国产在线无码制服丝袜无码知名国产|国产免费久久精品44|东京热aⅤ无码一区二区|国产成人综合久久精品推最新

<menu id="koaeg"></menu>
  • <dd id="koaeg"><s id="koaeg"></s></dd>
  • <abbr id="koaeg"><abbr id="koaeg"></abbr></abbr><dfn id="koaeg"><input id="koaeg"></input></dfn>
  • <strike id="koaeg"></strike>
  • 東南教育網(wǎng)您的位置:首頁 >教育 >

    谷歌掃描數(shù)以百萬計的大學(xué)圖書館書籍的努力發(fā)生了什么

    導(dǎo)讀 這是一個瘋狂的想法:拿走世界上大部分的書籍,掃描它們,并為所有人創(chuàng)建一個巨大的數(shù)字圖書館。這就是谷歌在2002年開始實施雄心勃勃的圖書

    這是一個瘋狂的想法:拿走世界上大部分的書籍,掃描它們,并為所有人創(chuàng)建一個巨大的數(shù)字圖書館。這就是谷歌在2002年開始實施雄心勃勃的圖書數(shù)字化項目時夢寐以求的事情。它在那里得到了部分成果,數(shù)字化了至少2500萬本來自主要大學(xué)圖書館的書籍。

    但承諾的一切圖書館尚未形成。作者和出版商以及互聯(lián)網(wǎng)巨頭因涉嫌侵犯版權(quán)而進行的史詩般的法律斗爭拖延了多年。一項本可以創(chuàng)建圖書版權(quán)登記處并通過公共圖書館終端訪問Google圖書館的解決方案最終在2011年被一名聯(lián)邦法官拒絕了。盡管同一位法官最終在2013年駁回了此案,一場讓它繼續(xù)掃描的勝利,輕松完全訪問所有這些作品的夢想仍然就是這樣。

    今年早些時候,大西洋的一篇文章哀嘆拆除它所謂的“我們這個時代最偉大的人文主義項目。”作者,一位名叫詹姆斯·薩默的程序員,這樣說:“Google的某個地方有一個包含25個數(shù)據(jù)庫的數(shù)據(jù)庫。一百萬本書,沒有人被允許閱讀它們。“

    這種評估在技術(shù)上可能是正確的,但許多圖書館員和學(xué)者對項目的遺產(chǎn)有不同的看法。事實上,學(xué)者現(xiàn)在經(jīng)常利用谷歌幫助創(chuàng)建的數(shù)字化材料庫,將其用作可以查詢的數(shù)據(jù)集,即使他們不能使用全文。它是人文學(xué)科與大數(shù)據(jù)日益接觸的支柱。

    它也是其他類型研究的便利資源。“如果沒有谷歌圖書搜索,那么很難想象我們學(xué)習(xí)這項工作的日子不會觸及那些不會出現(xiàn)的東西,”現(xiàn)任臨時教務(wù)長兼密歇根大學(xué)學(xué)術(shù)事務(wù)執(zhí)行副總裁的保羅·庫蘭特說。當(dāng)谷歌第一次接觸大學(xué)關(guān)于掃描其圖書館內(nèi)容時,Courant也是密歇根州的臨時教務(wù)長,這項建議讓他既“欣喜若狂又持懷疑態(tài)度”,他說。

    “無論如何,我不是谷歌所有人的粉絲,”Courant現(xiàn)在說道。“但我認為這是一項令人震驚的努力,其后果持久,其中大多數(shù)都是積極的。”

    谷歌的掃描項目幫助在一個不斷擴展的網(wǎng)絡(luò)研究網(wǎng)絡(luò)中建立了一些重要的節(jié)點。作為交易的一部分,谷歌的合作伙伴圖書館確保他們必須保留掃描作品的數(shù)字副本,以供研究和保存使用。這些材料幫助建立了一個名為HathiTrust數(shù)字圖書館的合作伙伴關(guān)系。根據(jù)其執(zhí)行董事Mike Furlough的說法,該公司成立于2008年,總部設(shè)在密歇根大學(xué),現(xiàn)已發(fā)展到包括128個成員機構(gòu)。它現(xiàn)在包含超過1570萬卷??紤]到多卷期刊和重復(fù)副本,這是大約800萬個獨特的項目,其中約95%來自谷歌的掃描。根據(jù)Furlough的說法,其余部分來自互聯(lián)網(wǎng)檔案館正在進行的掃描工作和本地數(shù)字化工作。

    這種豐富的資源已被用于多種好的用途。通過HathiTrust研究中心,學(xué)者們可以利用Google Books語料庫進行計算分析 - 例如查找大量文本中的模式 - 而不會侵犯版權(quán)。禁用打印的用戶可以使用輔助技術(shù)來閱讀掃描的書籍,否則如果不是無法以可訪問的格式找到這些書籍。

    Courant和其他參與掃描工作早期的人都承認好處和不足。“對于我來說,普遍的書店兼圖書館失敗對我來說是一種悲傷,”他說。雖然谷歌在項目進行過程中大大改進了掃描技術(shù),但它最終無法解決持續(xù)的文化挑戰(zhàn):如何平衡版權(quán)和合理使用,并讓每個人 - 作者,出版商,學(xué)者,圖書館員都滿意。這項工作仍然存在。

    盡管法律糾紛和和解失敗,瑪麗蘇科爾曼認為該項目是凈收益。美國大學(xué)協(xié)會現(xiàn)任主席科爾曼于21世紀初擔(dān)任密歇根大學(xué)校長,當(dāng)時谷歌聯(lián)合創(chuàng)始人拉里·佩奇(密歇根校友)通過掃描思想與母校接洽。科爾曼說,這所大學(xué)的許多館藏“對世界都是看不見的”。谷歌的參與承諾改變這一點。

    她說,如果沒有谷歌的支持和技術(shù)能力,像HathiTrust這樣的資源將更難創(chuàng)造。“如果沒有谷歌,我們不可能做到這一點,”科爾曼說。“我認為,谷歌這樣做的事實使事情發(fā)生的速度要快得多,如果沒有中央推動力,大學(xué)就會這樣做。”

    轉(zhuǎn)變獎學(xué)金

    泰德安德伍德的工作是谷歌掃描推動所產(chǎn)生的獎學(xué)金中最突出的一個例子。安德伍德是伊利諾伊大學(xué)信息科學(xué)學(xué)院的教授和LAS百年學(xué)者,以及伊利諾伊大學(xué)信息科學(xué)學(xué)院的教授(以及數(shù)字人文世界的領(lǐng)軍人物),他將谷歌圖書對他的獎學(xué)金的影響描述為“完全變革性的。 “HathiTrust提供的資源,即使是那些仍然受版權(quán)保護的資源,已經(jīng)擴展了他能做的事情以及他提出的問題。

    “我以前完全在英國浪漫時期工作,”安德伍德通過電子郵件說。“現(xiàn)在我花了很多時間在過去的兩個世紀里大致研究歷史,其原因基本上就是Google Books。”

    HathiTrust研究中心允許Underwood和其他人使用受版權(quán)保護的材料。“我無法在物理上獲取版權(quán)或分發(fā)文本,但我可以在一個安全的數(shù)據(jù)膠囊內(nèi)工作并測量我需要測量的東西來進行研究,”他說。“所以這并不像我的項目必須在1923年戛然而止,”他說。(那一年標志著進入公有領(lǐng)域的材料與那些仍被鎖定的材料之間的巨大鴻溝。)

    Data Capsule是一種安全的虛擬計算機,允許所謂的“非消耗性”研究,這意味著學(xué)者可以在不下載或閱讀文本的情況下對文本進行計算分析。該過程尊重版權(quán),同時支持基于受版權(quán)保護的材料的工作。

    對于安德伍德來說,這使得有可能在1800年至2007年間與加州大學(xué)伯克利分校的David Bamman和伊利諾伊大學(xué)的Sabrina Lee一起開展類似小說性別平衡的合作研究。安德伍德去年在一篇博客文章中描述了這項工作的重點。

    “我們發(fā)現(xiàn)的標題結(jié)果是,女性在19世紀同樣代表英語小說作家,并在20世紀戲劇性地失勢,”他說。男女比例從1850年左右的1:1下降到一百年后的約3:1。

    安德伍德說:“相當(dāng)劇烈的變化,并且在錯誤的方向上,這看起來非常違反我們最初并不相信我們從HathiTrust得到的結(jié)果。” 但是,由于Underwood和他的共同調(diào)查人員正在探索的原因,與Publishers Weekly的交叉檢查確認了大約在1970年左右的下滑。

    網(wǎng)絡(luò)圖書館

    最近任命的東北大學(xué)圖書館館長Dan Cohen表示,谷歌圖書和HathiTrust也被視為研究圖書館如何進化而不僅僅是將自己視為獨立的知識倉庫的“標志性例子” 。他還是信息合作的副教務(wù)長和那里的歷史教授。直到最近,他還是美國數(shù)字公共圖書館(DPLA)的執(zhí)行董事。

    對于那些負責(zé)管理學(xué)術(shù)圖書館的人來說,“作為一個獨立的機構(gòu),圖書館的偏心確實會產(chǎn)生長期影響,”科恩說。這種轉(zhuǎn)變與研究人員現(xiàn)在如何運作相對應(yīng) “他們并不期望從他們的家庭機構(gòu)獲得所有東西,”他說。“他們期望資源將集體持有并可在網(wǎng)上獲得。”

    這種不斷擴展的數(shù)字現(xiàn)實使得批判性地關(guān)注谷歌掃描工作的結(jié)果變得更加重要。非營利組織Ithaka S&R的圖書館和學(xué)術(shù)傳播項目主任Roger C. Schonfeld正在與前Ithaka S&R總經(jīng)理Deanna Marcum合作撰寫一本關(guān)于Google Books項目的書籍,現(xiàn)在是該高級顧問。

    “我們真正想要提出的問題是,為什么這么多的數(shù)字化都會以這種方式發(fā)生,以及其他方式會發(fā)生什么?”Schonfeld說。谷歌的技術(shù)和財務(wù)實力極大地加速了數(shù)字化進程,但該公司的優(yōu)先事項不一定是其圖書館合作伙伴的優(yōu)先事項。

    Schonfeld指出,隨著研究人員開始使用谷歌圖書,必須要知道項目提供的材料中可能存在哪些選擇偏差。“正如任何進行歷史研究的人都知道的那樣,你不可能擁有你可能希望擁有的所有資源,”舍恩菲爾德說。

    為了充分判斷Google圖書的價值,研究人員和圖書館員需要批判性地檢查掃描的內(nèi)容以及收集的內(nèi)容。并非所有圖書館都包含在Google的項目中,沒有圖書館擁有所有內(nèi)容。“現(xiàn)在有什么,什么不存在?”舍恩菲爾德問道。“該系列的創(chuàng)作和選擇固有的偏見是什么?”

    這些問題表明,在某種程度上,通用圖書館總是一個不可能實現(xiàn)的夢想。但谷歌圖書確實產(chǎn)生了實質(zhì)性的結(jié)果,即使它們不完美和不完整。(一種流行的工具是Ngram Viewer,它允許用戶搜索Google Books數(shù)據(jù),查找特定單詞隨時間推移的情況。)

    就其本身而言,谷歌目前對這一掃描項目的公開聲明并不多,盡管工作還在繼續(xù)。

    谷歌書籍產(chǎn)品經(jīng)理Satyajeet Salgar通過電子郵件表示,“十多年來,谷歌一直致力于通過簡單的查詢來提高書籍所含知識和藝術(shù)的知名度。”正在繼續(xù)為這個改變世界的指數(shù)數(shù)字化和添加書籍,提高我們的圖像處理算法的質(zhì)量和搜索的有效性,并計劃在未來幾年繼續(xù)這樣做。我們很自豪能夠繼續(xù)使它變得更容易人們可以使用這個產(chǎn)品找到閱讀和進行深入研究的書籍。“

    更多數(shù)字化內(nèi)容是好的。但是,大學(xué)和圖書館可能會考慮如何繼續(xù)開展活動以使這些內(nèi)容最有用。

    正如Paul Courant指出的那樣,“最大的問題不是進一步的數(shù)字化”,而是獲取。HathiTrust在作者和出版商提起的單獨的合理使用訴訟中占了上風(fēng)。但Courant說,過多的遺體仍被鎖定,孤兒作品的問題 - 那些版權(quán)狀態(tài)不明顯的 - 尚待解決。

    對于HathiTrust的執(zhí)行董事Mike Furlough來說,由圖書館社區(qū)來決定谷歌幫助啟動的地方。他指出了一個不斷發(fā)展的國家數(shù)字基礎(chǔ)設(shè)施,部分資金來自聯(lián)邦博物館和圖書館服務(wù)研究所以及像Andrew W. Mellon基金會和斯隆基金會這樣的私人團體。

    通過推動數(shù)字化,Google Books也幫助打印收藏品。根據(jù)HathiTrust的共享打印計劃,該聯(lián)盟的一些圖書館成員同意保留每份數(shù)字化專著的印刷版。“我們并不是說數(shù)字就足夠了,”弗洛說。“我們說數(shù)字是一種補充。我們認為印刷品不會消失。“

    弗勞說,谷歌的掃描工作“令人難以置信”。“剩下的就是找出剩下的東西。它并沒有讓我們一路走到盡頭。“

    鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請第一時間聯(lián)系我們修改或刪除,多謝。