對于數據來源的識別,一般需要有特定信息來記錄數據的來源,特別是一些大型企業(yè)當然分支機構較多的公司企業(yè)政府,也應該這樣來管理。在現(xiàn)實中稍微規(guī)模大一點的軟件系統(tǒng)涉及到的組織機構都是比較大的,有很多還可能是松散的組織管理模式。
在這類組織機構中,同樣的業(yè)務數據可能很多部門都會是數據錄入點和數據分析點,為此可以從數據采集/來源角度來描述數據本身。從當前項目利益來說,數據來源管理方便數據查詢分類,長期來說可以建立起數據信任等級。事實上,數據來源管理是數據信任管理的進一步延伸,是數據信任管理的前置條件。一個數據,可以是來自于A部門的也可能是來自于B部門的。為了方便統(tǒng)計查詢和數據信任管理的加強,應該記錄下數據的來源地。
具體操方式可以有以下幾種:
1) 數據錄入人員的工作人員編號,知道了數據錄入人員的編號,就知道數據的來源地。當然,實際工作種存在人員調動,替操作(1個人用另外一個人的身份進入系統(tǒng)數錄入),這些都有可能需要考慮到,否則可能造成數據來源管理失效。
2)另外一種方式就是直接記錄數據錄入的部門編號。
這種方式弊端就是不能記錄下數據的具體操作人員。其它說明:如果系統(tǒng)中引入了工作流產品,數據來源這部分工作可以由工作流來擔任。具體例子:在現(xiàn)實的軟件系統(tǒng)中可能存在一個主數據庫/數據中心,若干分數 據庫/數據中心,系統(tǒng)在每過一定時間進行數據上傳/下載,為了進行數據合并和控制數據的修改,應該每個分數據中心只能處理修改自己的數據,可以查詢總數據 中心/其他分數據中心的數據。如果沒有引入數據來源管理(數據屬地管理)和數據版本的控制機制,不知道系統(tǒng)在作數據中心合并會怎樣子?
1.數據項的分類編碼
數據項的分類編碼,實際上是數據項來源管理的一個具體延伸。數據項編碼的目的就是更快更好的識別數據代表的業(yè)務意思。一個典型的例子就是ERP中的BOM表(基本物料清單)。 數據項的分類編碼,不只是在系統(tǒng)模型建立上有指導意義,在進入系統(tǒng)的業(yè)務數據的規(guī)范化同樣有指導意義。
數據項的業(yè)務編碼和系統(tǒng)編碼分離。業(yè)務編碼很多時候只是為了識別業(yè)務數據的需要,很難保證業(yè)務數據的唯一性要求。而且業(yè)務編碼可能會發(fā)生變動,有些單位的 總體規(guī)劃從調研到討論制訂、到項目審批通過,再到最終實施,常常幾年過去了,需求發(fā)生變化,這種編碼規(guī)則不發(fā)生變動幾乎不可能。
2000年我參與的一個企 業(yè)軟件系統(tǒng),就一個產品編碼規(guī)則2個月就發(fā)生了5次變動。從更長的時間范圍內來說,應該考慮數據產生時期問題,不同時間階段產生的業(yè)務數據,使用的業(yè)務規(guī) 則不一樣,數據編碼這個層次很多時候很難識別 數據當時的業(yè)務環(huán)境。
以一個簡單的例子來說明:
業(yè)務數據表的primary key系統(tǒng)應該是系統(tǒng)定義的,而數據項的業(yè)務編碼只能作為索引或者備用鍵使用,這樣就減少了數據業(yè)務編碼規(guī)則的變動對系統(tǒng)影響減少到更小的程度。
2.業(yè)務規(guī)則使用的版本化
前面已經提到了數據錄入的版本化,還有算法的版本化,也就是計算結果的版本化。但是還沒有談到一點,到底啥時間該采用哪
項目經理勝任力免費測評PMQ上線啦!快來測測你排多少名吧~
http://www.vanceur.cn/pmqhd/index.html