Management

研究數據庫:訪問和所有權政策

  • February 12, 2011

我是一個學術研究實驗室的博士生。我的項目的一部分涉及收集樣本和生成數據。另一部分涉及建立一個研究數據庫來儲存結果。隨著項目的發展,一名碩士生和兩名博士後也在研究樣本並生成數據。與我收集的樣本相關的所有數據都將被添加到數據庫中,無論是誰生成了數據。數據庫中的每個條目都有一個“所有者”欄位來跟踪這一點。我們的主管希望該數據庫也能被從事其他項目的人員更廣泛地使用。

關於將數據/結果送出到“我的”數據庫,我遇到了我們小組成員(包括“我的”項目和他們自己/其他項目的工作)的一些阻力。在最近的一次會議上,我再次解釋了(中央)數據庫的概念,查詢可以輕鬆提取數據,“所有權”欄位跟踪它的數據點,並提醒大家中央數據庫的好處它儲存所有生成的數據。我強調了可以對不同數據集進行比較分析的類型,如何進行薈萃分析等等。然後我提出圍繞數據庫管理和所有權問題進行一些研究。小組中的一些人在論文發表之前不想將數據送出到數據庫,儘管小組中的其他任何人都不可能僅僅從數據中簡單地拼湊出一篇“有競爭力的”論文並“首先”發表。這也是不切實際的,因為這意味著從未發布的數據永遠不會添加到數據庫中。這也意味著在論文發表之前沒有其他人可以訪問它,從而減慢了其他研究的速度。此類數據的內部共享應該是正常的。

我將不勝感激有關這些問題的任何資源建議或評論。每個人都應該簽署一份關於他們的數據進入數據庫的“棄權書”和另一份關於使用來自數據庫的數據的“棄權書”嗎?我們不是一個特別不信任的團體,但該團體中的其他人都是“濕實驗室”研究人員,因此數據庫和共享數據的概念對他們來說可能有點陌生。

歡迎來到辦公室政治。諸如有關數據披露的 NDA 之類的事情可以對此有所幫助。您的顧問和大學法律部門應該能夠幫助您起草這些文件。

我在這個問題上被撕裂了……是的,問題是資訊政策,不一定是數據庫實施,這就是為什麼我不希望這個網站稱為“數據庫管理員”,儘管即使對於“數據庫專業人員”來說,如果它是否在主題上。

我無法直接回答您的問題,只能說如果您從頭開始,您可能做錯了。

搜尋術語“數據儲存庫”+您的學科,以及“資訊學”+您的學科。(雖然,如果你搜尋“醫學資訊學”,你會發現一個巨大的領域)。

您處於一個特別棘手的情況,與醫療資訊一樣,您必須遵守 HIPPA,因此您需要確保您已從數據中刪除任何 PII(個人身份資訊)。

一些“小科學”領域正在使用Fedora RepositoryDSpace來管理他們的內容,但我不知道它是否有滿足您精細授權需求的規則。大多數“大科學”領域都傾向於推出自己的產品,但也有一些更通用的產品,比如iRODS,它可以連接多個後端和OODT(以前是 JPL,現在是 Apache)來阻止你從頭開始設計東西向上。

……但我希望在你的領域從事資訊學工作的人——他們可以告訴你是否有你的學科的元數據標準,是否有任何類型的儲存和管理標準化,甚至是某種現有的聯邦。

……至於出版——這是一件大事;許多學科在研究發表之前會禁止數據;一些期刊不接受可公開訪問的儲存庫中的論文,因為他們認為它是“以前發表的”,但大多數(不是全部)將豁免“機構儲存庫”(那些只有研究人員所在的地方的人可以訪問的)工作),在它被接受出版後,如果它是聯邦資助的研究,你可以利用一些漏洞。

引用自:https://dba.stackexchange.com/questions/1179