本网站暂停更新,本人的专业活动已融入“书社会”,请移步 [sns.libspace.org] 。多谢关注。
Tags: UncategorizedRelated posts
- 无相关日志.
38281 items (11645 unread) in 230 feeds
Lis
(5690 unread)
SinaCircle
(4488 unread)
LisEN
(25 unread)
xmulib
(762 unread)
inactivated
(74 unread)
Misc
(560 unread)
RuralLibrary
(46 unread)
上周在市政协听了一个演讲,一个美国人讲保障性住房政策,很多朋友说:“美国有经验?教训还差不多!”
但听了他的演讲你会发现,这个Nicolas先生确非等闲之辈。
作为哈佛大学联合房产研究中心主任,作为一位曾在政、商、学三界爬滚多年,目前还担任美国多家不动产杂志专栏作家,尼古拉斯先生的观点很直接,很简单,很实在。
他首先回顾了历史,说美中两国从完全不同的两个方向,走向了同一个理想:即“每一个家庭,都应该有体面的居住”。
美国是从来不顾劳动人民的住房的。土地私有,住房是商品,从一开始就放任市场运作。1890年前后,政府开始关心百姓的住房,是基于卫生的理由,而非人权。到三十年代大萧条之后,国家建造住房,主要也是为了解决就业问题。目前美国大约有5%的国有住房,租住给排队等候的水深火热中的人民。美国政府早已放弃了建设“保障性住房”的责任,因为人民不答应,无论哪个社区也不愿意与“贫民窟”为伍。(而且美国历史上曾发生“城市空心化”过程。)所以美国一般是通过发放补助形式恩泽众生。政府的保障行为,不能破坏市场的公平性。(强行规定房价就是影响市场的做法,还滋生不公甚至腐败)
而中国老大哥一开始并不承认房地产的商品属性,一切公有,国家分配,直到难以为继。并且一直到现在还在痛苦中摸索,摸着石头过河,似乎越弄越不不公平。
尼先生在演讲中提到保障性住房建设的一些经验教训:
1、需求有不同,保障也应该有层次。
2、人们应该有选择,租房并不可耻。
3、保障性住房不仅仅是保障居住,还必须有医院、学校等配套环境。
4、集中保障不一定可取,可政策性保障,要求建筑商必须附带条件(例如批地附加一定比例的保障房,在税收等方面予以减免优惠)。
5、住房必须与就业综合考虑,保障房不是流放地。
另一方面提到几个原则:
1、住房是私有财产,交给市场做才最公平。政府做的唯一目的是保障,不是营利(保值增值)。
2、“居者有其屋”也是有尊严的居住,甚至可以更有尊严,应该鼓励。
3、住房作为投资走得太远,就要吃苦头。(美国的教训是:忘了住房是消费品而只当作投资品,以为它永远值钱)
4、城市的经济增长依靠房地产是不健康的。
5、规则程序必须公开,操作应该透明,衍生品炒作就会适可而止。
“美国那么正确,为什么会发生房利美房地美倒闭涅?为什么会引发出整个金融危机涅?”演讲之后的提问阶段,有人明嘲暗讽地问了这个问题。
尼先生说,关键在于美国人没有很好地理解什么叫“居者有其屋(体面的居住)”,认为体面的居住就是“拥有巨大的房产”。而美国政府没有及时预警,却放任自流,甚至予以鼓励,放松了监管。
他最后直面听众的提问,对政府能做什么,不应做什么,能走多远?如何利用市场机制解决问题?何时可能出问题?如何预警?如何解决问题?等等,谈了自己的看法。老美很会说话,一方面很技巧地恭维贵政府,能够及时预警问题,就能够拿得出对策,同时也明确地说出自己的观点:政府不能迁就既得利益者,误导心理预期,默认甚至支持房价飙涨,作啦啦队长…
但是,老大哥听得进去吗?
Tags: Nicolas Retsinas, 保障性住房, 笔记, 美国, 讲座
我们都是成年人,笼统、感性地谈论对谷歌愈挫愈坚的爱情,难免给人留下不理智的口实。
老打口水仗也没意思。
还是让我们理性地分析一下谷歌 数字图书馆计划都做了些什么,对当前和未来会产生什么影响。
首先,谷歌跟哈佛、密西根、斯坦福、纽约公共、牛津、加州大学、CIC和一些美国之外的图书馆签订协议,扫描它们的馆藏,完成后数量应该有1500万种。加上其与出版商的合 作,以及雄心勃勃的全球计划,成为最大的“图书”馆只是时间问题。
其次,跟其合作的图书馆,能得到些什么?
1、免费得到原书的影 像版;
2、免费得到原书的OCR文本(支持全文检索);
但是在服务方面必须按照现行的版权法,即,这些图书馆不能用这些电子书提供服务, 除非:向视障人士提供,用于研究——例如词频统计之类,以及原书破损之后的复制重印。
那么整个过程,谷歌为什么引起了公愤?它挑战了什 么?
主要是挑战了“合理使用”,主要涉及市场上已经绝版,但仍在版权保护期内的著作。
作为与美国出版商协会和作家协会的和解协议 的具体措施,谷歌须建立一个Book Rights Registry(图 书版权登记处)作为一种权利费用的偿付机制。该机构由谷歌提供创立经费,登记的内容包括“作品”“权利人”“支付标准和方法”,将来是非盈利、自我支持的 机构。
谷歌通过和解协议,得到了继续扫描绝版书的权利。当然,这个权利并不是排他的。谷歌当然会利用这些扫描的图书提供服务,但是否获 利,或者获利是否合法,就要看它的具体商务模式了。就目前它通过在搜索中定向发布广告获得的利益,已达成一个分享方案:谷歌得37%,登记的权利人获得 63%,而成为合法。
谷歌于是在这个领域成为一家独大的寡头。
受限那么多,“谷歌数字图书馆”计划,究竟给图书馆行业带 来些什么?
图 书馆可以像对待任何出版商一样,“订阅”谷歌图书(订阅意味着协议付费)。订阅之后,图书馆拥有的权利如下:
对于不订阅的公共图书馆,谷歌可以给每个馆提供一台终端进行查询浏览,打印需要支付版 权费。
如果是非图书馆的其它机构,则可以检索、预览、付费打印等。
对于个人用户,如果是绝版书,可以检索和预览不超过20%的页面,不允 许打印和拷贝。将来可能会提供购买链接,以及按需打印的电子商务服务。
图书馆人对其不彻底的革命感到担心,并因为挑起这场革命的不是自己 而失落。主要表现在:
1、对其面对图书馆行业的“商人面孔”感到不满。利用了图书馆,抢了图书馆的饭碗,居然还来挣图书馆的钱;
2、对其 是否可持续,表示忧虑;它毕竟不是图书馆这种社会事业,而是一个商业性公司;
3、对其中立性,保护读者隐私,以及排序过滤的方法等感到担忧;
4、 其价值观与图书馆行业肯定是不同的,它不可能把保障“普遍均等的服务”和“平等获取信息的权利”当作首要原则。
参考文献:
1、 Karen Coyle’s slides: Google Aap Settlement [www.slideshare.net]
2、Google 图书搜索和解协议 [books.google.com]
3、Google Book Settlement [books.google.com]
4、2 page Super Simple Summary [wo.ala.org]
——————————评论(15个)三八线—————————————
张甲老师,那只是个伎俩,难道你忘了这是贵国宣传工作的革命传统──咱 跟谷歌不是崩了吗?那就必须得组织文章来批谷歌。咱不占理,但得占舆论。
谢 谢提醒。
这是发在书社会的一个帖子,引起热烈讨论,贴在这里让它继续发酵吧。
顺便做个书社会的广告,要加入可以点击 这里。
______________________________以下转贴______________________________________
前些日子接到学姐发来的邀请,希望就谷歌数字图书馆计划,为他们的馆刊写点看法。
题目是这样出的:
在这样一个悲情的日子谈谷歌,不由我不愤青一些,更加旗帜鲜明地说出我的观点:
一、 哥不是一间公司,哥是现代版的亚历山大图书馆。
亚 历山大图书馆是我们这个专业难以企及的神话,就像通天塔之于上帝,就像西西弗斯之巨石。Google昭告天下的使命是:“整合全球范围的信息,使人人皆可 访问并从中受益(To organize the world’s information and make it universally accessible and useful)”。2001年2月美国信息技术咨询委员会(PITAC)向布什总统提出报告:《数字图书馆:实现对人类知识的普遍访问 (Digital Libraries: Universal Access to Human Knowledge)》与谷歌的理念异曲同工。有人据此调侃,2049年前后,美国政府将宣布谷歌作为其国家图书馆之一。
图书只是谷歌信息世界的很小一个部分。人类目前保存在世的图书总数有多少?据估计也就1亿种左右。谷歌与图书馆和出版商合作的Google 图书搜索计划目前已达到1000万种图书的规模。最早与谷歌合作的五家图书馆:密西根、斯坦福、哈佛、牛津 Bodleian四个大学馆以及纽约公共图书馆,在世界上可算是业界翘楚,其馆藏总和不过1500万种。谷歌打算投资2亿美元,在2014年前完成这个数 字化项目。各国面对谷歌这项史上最大公益性事业的聒噪大多是一种狭隘的民族主义,或者以己度人的小人心态。谷歌认为他是在帮助图书馆实现自己的理想,他是 图书馆事业的有机组成部分,图书馆收藏有全部图书文物,而通过谷歌提供阅读服务。
二、哥不仅是一个图书馆,哥还是另一场古登堡发明和纸皮书革命
可敬而又可畏的其实并非谷歌侵入图书馆的领地而广施善行于世人,而是敢 于挑 战日渐腐朽过时的传统版权制度,营建新的利益平衡和知识秩序。
随着2008年10月Google就其扫描的绝版书与美国出版商协会 和美国作家协会达成赔偿1.25亿美元的和解协议,Google几乎就是拿到了合法的对于传统版权制度进行“侵权”执照。即便该和解协议覆盖范围极其有 限,这个模式也将为同类纠纷提供参考。这个世界还没有其他的“唐杰柯德”能够出得起Google的价码。
谷歌正在以新的商业模式探索数字时 代的知识产权保护规则。谷歌正在建立一个无比巨大的信息分销零售平台,凭借其所向披靡的搜索引擎和领先的技术优势,将人类的智力产品搜罗、标注、索引、组 合,其载体类型扩展到期刊、报告、 会议录等几乎所有传统学术出版产业中,数字媒体自然更不在话下。其内容帝国进一步与新闻、多媒体行业融合,在整个内容产业中攻城略地,依靠其平台和商务模 式,左右整个内容产业链。当然,这个领域也并非只有谷歌一个玩家,亚马逊、苹果也是其中翘楚。
三、图书馆是世界上最无私的事业,应该敞开胸怀,拥抱谷鸽及其同类。
谷歌的战略布局已经初现端倪,代表了先进生产力,任何企图抵抗的力量都将不堪一击。由Internet Archive、微软、雅虎等组成的“开放内容联盟”曾经也想在这个领域分一杯羹,但在扫描了75万册图书之后,还是放弃了。当初微软的决策纯粹居心叵 测,几乎完全是出于搅局的冲动,而非真心公益。其它类似的数字化项目还有中美百万册图书计划、古登堡数字图书馆计划和美利坚记忆数字图书馆项目等,从规模 上和技术上不能跟Google图书搜索计划相比,但也是给数字图书馆事业添砖加瓦。我们图书馆人并无自己的私利,为读者服务就是我们的最大利益。我们完全 可以利用好一切资源,谷哥正是我们最好的兄弟。


————————评论区分隔符————————————
下面是原帖后的留言评论,没想到引起这么大的争议,留言已达64条之多,其中很多都具有相当的代表性,反映了人们的认识是多么的“多元”啊!是非对错每个人都有自己的判断,一定要辩个清楚明白本身就不符合网络世界和谐共存的理念,呵呵。
如果有当事人不愿意在此贴出,请告知我(kevenlw at gmail.com),即删去。
————————以下为留言讨论———————————
程亮 2010-04-02 01:23 就怕新垄断和文化沙文主义。。。
心态有问题
Google就是这个亮点,呵呵
聊发少年狂哦,哈哈。
我怕他们一旦形成自然垄断,就一定会扩大垄断利益,说实在, 我对资本的心态是不怎么好。。。
你 这是我以前的观点。你觉得现在这种清醒不是扯淡吗?
听 其言,观其行。资本是充满丑恶的,相对于权贵来说,资本还算是比较公平的。我们不能因为生活中充满丑恶就不相信美好,特别是美好当前的时候。那样的话就太 可悲了。
相信美好,生活才有希望.支持谷歌!支持K师!
资 本是从属与契约的。当资本和公共事务达成契约,想作恶也不是那么容易。即使有钱买下资产,没文化也只有搞死。贵国4年前发起的第一波赤膊冲锋已经死在沙滩 上了。
1、版权是技术发展的产物,也会随技术的发展而发展。破坏现有制度是需要代价的,包括我们的观念更新 的代价;我们习惯于神话制度,崇拜权威。
2、更乐于拥抱新技术的绝不是图书馆行业,而是产业界。只有他们才有打破现有格局而大发横财的动力(但也绝不是中国产业界,中国科技创新的主体在于领导而 不在企业)。对于图书馆而言,正因为目前技术进步的风暴中心在于信息技术,已经侵入家门了,不可能没有影响。9大高新技术,我们能够置喙的有几项?生物技 术?新能源?
3、敦煌经卷的案例已经很说明问题了。数字化信息也是一样。
版权的发展毋庸置疑,图书馆也乐见Google挑战版权,反正现代版权制度又不是图书馆生存基础, 反而很多地方受制于版权制度,违背了自己公益之心。但Google挑战版权与否如何挑战版权与图书馆如何处理与Google的关系是两码事。图书馆与 Google,如果太过死心塌地,那注定是一场孽恋:拥抱你,甚至爱上你,并心甘情愿被你一刀捅死。图书馆死了没关系,死之前还帮人数钞票就太伟大了。无 论如何,图书馆应该拥抱的是多元世界,而不是独大Google。
您也太爱护图书馆了吧?图书馆在乎吗?这只是一项人为的制度设计而已,其实是最没有自我的一盘散 沙,好处是可以利用一切力量。Google独大而不作恶,我看没什么不好,图书馆又不需要托付终身,那么紧张干嘛?
1.图书馆是一项人为的制度设计——敢问社会中啥啥机构不是人为的制度设计呢?
2.图书馆是没有自我的一盘散沙——吗?
3.图书馆是可以利用一切力量——是利用还是被利用?
我不反对被利用,被利用说明有价值。短期内的G图相互利用未来会是如何呢?有价值是被利用的基础。
4.Google独大而不作恶,这点判断太过武断。希拉里找了几大网络公司高层午餐之后,Google就退出中国内地,不让人不怀疑Google是美国棋 局中的一个棋子,棋子有时候是无法决定自己是否要作恶的。
5.图书馆的未来在什么地方。如果Google数字化了地球并免费提供内星人和外星人访问,图书馆就可以不存在,那没关系,乐见如此;如果Google收 费提供访问,那么Google与现在的出版商又有什么不同呢,图书馆自然有存在的基础。
6。综上:Google是否数字化地球,与图书馆的态度无关。Google用一用图书馆,其不会给图书馆带来高潮,图书馆也不必假装高潮。
一个亲身经历,是件小事,但是我不相信google是不作恶的,虽然他很伟大。
1、现代企业制度就目前而言,是一项符合社会发展规律的制度,并且还能随着人 们对社会经济及技术发展规律的认识不断提高而发展,是一种活的社会组织形式,比较不具有人为的主观性。
2、图书馆从事业整体上而言,根本是违背很多规律的,贵国的图书馆行业本身自己就没多少利益,还争得不可开交,很少合作共享,在我看来比一盘散沙还要散, 简直是同行冤家。
3、不管利用还是被利用,只要对读者用户有益,就能实现图书馆的价值,就是图书馆的存在目的。
4、至少至今为止,Google是越来越伟大,越来越可爱了。从机制上讲,它的毛孔必然流出工人的鲜血,不过我们还是先擦干自己的鲜血再说吧。
5、图书馆的未来是不用发愁的,作为公司是没有永续经营的,但是作为图书馆这种“制度安排”,已经基本上成为缺省的民享设施了,即便是国家政权宣布 google为图书馆,我们也没办法,是波?Google就是出版商又怎么了?图书馆从来就是有能力与所有肮脏制度和平共处的。
6、不必太冷淡吧?
问题就在这儿。一问兄,这里我没有看到任何资本与公共事务的契约,因为没有任何真正代表公共事务的组织与机构与资本签 约了。我只有就事论事地看到某一个案件的和解。
其实我不是担心Google的作恶,就象韩寒所比喻的,在它之前或之后,要说作恶已经不知道有多少人了,好歹Google还付点银子的,很公平。其实它的 作法,不管是披着什么样的外衣,不管对社会是好是坏,我们都可以冷静观之,合作也不是问题。实在看不清楚的时候,用常识判断,这样我们至少知道它还是家公 司吧。而图书馆才是公共事务中的一份子,不能忘了自己公共与独立的精神源头。
资本就是资本,即使从资本的角度来讲,我也看到了此事自然垄断的倾向。所以就是从资本的角度来讲,Google也是个危险的主儿了。
谷 歌曾认为我的博客网站优化作弊,很久不收录我的域名,至今不允许我开通广告账户,曾经让我一周不能访问gmail(我曾经报道此事),我都非常恼火。但我 不认为那是作恶,那只是自私、自我保护而已。我歌颂自私,己所不欲勿施于人,保护自己才知道保护别人,才有助于人人平等的法治环境。我们经历过太多假高尚 之名侵害别人尊严和利益的事情。
这是一种极其 龌龊的做法,我当然反对。这是不能跟google的行为相提并论的,谷歌跟图书馆有协议,而且严格遵守。其根本区别不是是不是读者受益,而是目的是自己赚 钱。
禁止用户某些服务可以理解为自我保护,但是把别人明确禁止商业用途的资源提供给商业公司的到商业软 件,难道还不是作恶吗
我也怀疑,但是我鼓励Google,最好让它上套,骑虎难下,为此破产(当然不可能,leon说了,它是公共公司, 不像我们的公共公司,不仅共你的产,还让你赌瘾大发倾家荡产)。
必要时我会帮助google,不管这种力量是多么微小,我帮的不是哥,是哥的事业,同样就是帮了孔子、马克思、孙中山…,我也看不到完成的那一天,但 是我尽可能享受过程,过程中自然有高潮,可能只是我虚幻的小高潮而已,只要不是假高潮…
我觉得以后学术的东西应该开放存取,非学术的东西应该是您说的信息分销零售平台,有没有google也都会实 现吧。
同情 你。。。但是举证很复杂,何不通过法律渠道来讨个说法?现有体制下,也只能相信法律了。
google 只是个符号而已,什么东西都依赖它,也肯定不现实。希望千万个google站起来,嘿嘿。
想 到我还在用它的很多服务,我就原谅它了
谷歌与**公司只是盈利模式上的不同吧?何来一个伟大,另一个龌龊?
我已 经说清楚了:目的截然不同。俩愣头青看上你家千金,一个是爱上你家千金,一个是爱上你万贯家产,你应该嫁谁这都看不出来,还管他商务模式?
说清楚点:google books计划分两块,跟图书馆合作的那块是不允许拿来挣钱的。**公司的第一桶金是如何挣的我就不去说他了,这些个原罪都是要还的。
1.现代企业制度中的垄断企业和反垄断法律约束,本质上也是一种人为的制度设计。——Google几乎要成为垄 断企业了,就差图书馆届再给加把油了。
2.贵国的图书馆行业争名夺利的事不光是行业本身的问题,一个靠分享纳税人收入生存的行业怎么可能不练就一身争名夺利的本事呢。教育事业、卫生事业、文化 事业,争名夺利的事儿多了去了。
3.对读者用户有益,是看暂时有益还是长远有益了。读者的免费是从哪里来的?图书馆花钱买的。图书馆的钱是从哪里来的?纳税人的。谁是纳税人?图书馆的读 者。好,垄断之后的结果就是图书馆需要花更多更多的钱买访问权满足读者的需求。
4.擦干自己的鲜血,这里没明白。请K师指点、明示。
5.铱星电话系统作为人类历史上第一个真正意义的全球卫星定位系统,最开始是由美国一家公司建设、经营的。现在这家公司破产了,铱星系统就被美国政府接手 了。美国历史上这些例子很多,如果未来Google真被图书馆(政府)给接手了,也不错。
6.嘿嘿,冷淡是假装冷静。
Google的目的也是赚钱,这个Google自己也承认。
我家的千金就是我家的万贯家财。谢若琳说,你。。。你。。。你告诉我桌上这两根金条 哪。。。哪。。。哪一根是高尚的,哪。。。一根是龌龊的。Google和**公司就是那两根金条。
老马的观点在西方已经过时,但在中国正在上演。呵呵
谷歌退出内地是因为谷歌作恶还是GFW作恶?
关于垄断,图书馆人就不要瞎操心了,美国有反垄断法,如果Google成为垄断性公司,美国政府将会依 法拆分。图书馆人有时想得太多,等你想清楚了,世界早就变了。
商业公司难道不是公共事务的一部分?谁又是公共事务的主体?政府?
赞一个!发人深省!!
恰恰相反,以 2008年以来的数据分析,老马的观点正是研究热点。
谷歌退出内地是因为谷歌作 恶,这点在中国是有法理基础的。另外,GFW作恶并不能证明谷歌不作恶。
奇怪了,中国人干嘛要看美国法律为依据来判断自己是否想多了。
longway, 你这是典型的中庸之道,各打50大板。“GFW作恶并不能证明谷歌不作恶”可不是好的推理,能否说一说谷歌如何作恶了?
老魏也开始中庸了。为什么对“迹象”就要开始批评?我们理解迹象后面代表了何种事物?GFW就像戴墨镜看东西,两眼一抹 黑,什么都是阴暗的。老花镜看东西近地清楚,远地模糊,很多迹象都会出来。我们要有勇气用望远镜看东西,脚下可能会摔跟头,但大方向要清楚,这是信息时代 赋予我们的责任!
不 懂啊,google触犯了哪条法?不安政府的意愿办就是犯法?是否触犯法律应该由法院说了算,可惜政府并没有通过法律途径,可见没犯法。
赞!
同赞
关于 Google的不作恶,事实上这是一个非常扯的slogan。作恶与否,首先要确定恶的标准。如果恶的标准不一样,那么对于恶的界定也不一样,对吧。甲之 熊掌,乙之砒霜。我们就能说熊掌就是一定好东西吗?中国政府以某某国内法律要求Google对关键词进行过滤,如此要求Google不作恶,而 Google认为中国政府这是在作恶。因为Google拿着“普世标准”来衡量恶与不恶。
好,现在的问题就是恶的标准到底应该是什么?我认为目前是新旧标准互相博弈的阶段,没有一个明确的标准。这样的博弈和斗争在许多场合都存在,比如哥本哈根 会议上减排标准拟定,比如人民币的汇率是否合理。
还是没有明白Google如何作恶了。
举一个例子,你从超市买回一包大米,你们家的“领导”说必须把小一点的米粒挑出来才可以做饭,你说我不干了。这是你在作恶还是“领导”在无理取闹?
或许生产大米的公司有这种责任,但是不能要求背大米的人对大米袋里的内容负责。更何况有时小一点米粒的营养更好,“领导”根本无法代替使用者作出决定,因 为他根本不知道这袋米会是用来做米粉还是做米饭的。这样的人才是真正的可恶!
我能理解longway同学站在某种“后现代”的角度批判任何既定的标准(虽然我不确定这么说是 不是合适)。但是至少对我来说,在实践中,这件事里显然是有相对的谁对谁错,谁好谁坏的。

作者: (美) 亨德勒 / (美) 阿利芒ISBN: 9787115193841 页数: 330定 价: 59出版社: 人民邮电出版社装 帧: 平装出版年: 2009-2-1
第六章 RDF模式(Schema)本章开始是我真正感兴趣的所在了:本 体建模和本体编码。渐入佳境。
(一)
(二)
除了rdfs:subClassOf之外,RDFS还扩展了许多元素,rdfs:subPropertyOf是其中最重要的一个。
类有子类,也有 属性。属性有子属性。
[5]
ex:著 rdfs:subPropretyOf ex:创作
由:
[6] ex:曹雪芹 ex:著 ex:红楼梦
可以得到:
[7] ex:曹雪芹 ex:创作 ex:红楼梦
建模举例:
某图书馆的工作 人员中有职业的图书馆员,外聘的信息技术人员、外包公司的技术人员以及自由职业者,如果要建立他们与图书馆之间的各类用工关系,该如何做?
首先析 出需要描述的关系:合同关系contractsTo,自由职业freeLancesTo,外包公司indirectlyContractsTo,直接聘用 isEmplyedBy,以及笼统的用工关系worksFor。
所有职员与公司之间的这些关系,其实都是“属性”关系,应该用 rdfs.subPrepertyOf建立起联系。
上述五种属性之间的关系,用工关系包括合同用工和直接聘用,合同用工又包括自由职业者合同和外 包公司合同(用词在这里不一定符合中国法律,但语义就是这个意思)。可以作如下表达:
[8]
ex:isEmplyedBy rdfs:subPropertyOf ex:worksFor
ex:contractsTo rdfs:subPropertyOf ex:worksFor
ex:freeLancesTo rdfs:subPropertyOf ex:contractsTo
ex:indirectlyContractsTo rdfs:subPropertyOf ex:contractsTo
这样,如果:
Keven isEmplyedBy TheLibrary
机器可以得到以下推理:
Keven worksFor TheLibrary
如果:
Marcia freeLancesTo TheLibrary
Raizen indirectlyContractsTo TheLibrary
机 器就可以自动做出下面的推理:
Marcia contractsTo TheLibrary
Raizen contractsTo TheLibrary
属性之间的这种关系定义,在面向对象的编程中是没有对应规定的,这一点需要注意。
(三)
RDFS另外有两个重要扩展:rdfs:domain 和rdfs:range,它们也跟“属性(Property)”元素有关:rdfs:domain关乎属性的主语的取值,rdfs:range关乎属性的 宾语(对象)的取值,都是一种约束(限定),或者说提供了对三元组当属性词(谓语)确定之后,用来描述主语和宾语的限定的扩展元素。
举例说明如下:
[9]
如果属性P的值域(domain)为D,x的P属性是y,那么x的类 型一定是D。可以写为:
IF
P rdfs:domain D
and
x P y
THEN
x rdf:type D
[10]
如果属性P的范围(range)为R,x的P属性是y,那么y的类型一定是R。可以写为:
IF
P rdfs:range R
and
x P y
THEN
y rdf:type R
有 了这两个元素,就能够对于取值范围进行约束,从而可以采用规范词表之类的方法进行取值的规范控制。但是RDFS不能描述某一个实例不属于某个类(这在 OWL中得到了扩展),当定义了P的domain和range之后,如果有“x’ P y’”,不论x’或y’取何值,系统都必然地把它们归入预定的domain和range,加入预设的domain和range(例如规范词表或分类法)中 没有x’或y’的实例,就会发生矛盾,需要另外解决。
进一步,结合rdfs:subClassOf,可以有一些更有意思的推理:
如 果某个属性P有值域D,而值域D是D’的子类,则D’也是P的值域。表示如下:
[11]
IF
P rdfs:domain D
and
D rdfs:subClassOf D’
THEN
P rdfs:domain D’
具体举例:网页(D)是网络资源(D’)的子 类,具有URL的HTML页面(P)是网页(属于值域D),那么也一定是网络资源(属于值域D’)。
这里与面向对象的分析和设计似乎相反,类的属 性不是被子类继承,反而被超类获得。这是Web的特性决定的:属性自身就是资源,不专属于特定的类。
属性交集的例子:
[12]
如 果:
属性P ⊆ R ⋂ S
x P y (x的P属性值为y)
则:
x R y (x的R属性值为y);
x S y (x的S属性值为y)。
(四)
例子:
甲图书馆用 Lib1:borrows表示外借图书,乙图书馆用Lib2:checkedOut来表示,一个Web应用要将他们的外借数据合并,可以采用以下方法等同 这两个属性:
Lib1:borrows rdfs:subPropertyOf Lib2:checkedOut
Lib2:checkedOut rdfs:subPropertyOf Lib1:borrows
然后,让这两个属性共同作为一个属性的子属性:
Lib1:borrows rdfs:subPropertyOf ex:hasPossession
Lib2:checkedOut rdfs:subPropertyOf ex:hasPossession
这样,使用ex:hasPossession就可以获取所有两个图书馆 外借图书的数据了。
这种方法可以用来整合多个不同的元数据方案。例如,用DC元数据元素作为“核心集”时,MARC等不同元数据方案中的 诸如ex:author,ex:editor之类的元素,都可以 subPreportyOf dc:creator,就可以支持DC标准作为统一查询的元数据标准了。
不用作推理的RDFS元素还有如下一 些:rdfs:label(给定一个显示 名),rdfs:seeAlso(交叉参考),rdfs:isDefinedBy(定义主体),rdfs:comment(注释)等等。
总结一下:
RDFS是用来描述RDF的模式语言,主要提供了定义类(class)、类与类之间的关系(subClass)、属性 (property)、属性之间关系(subProperty)的方法,并规定了简单的、基于集合理论的类继承规则,以及属性继承规则。可以看出RDFS 对RDF的上述扩展,也是完全基于RDF的(全都是三元组),这也保证了RDFS可以像RDF一样,具有同样的开放性,任何人都可以用来定义任何RDF模 式。
虽然RDFS引入了值域和范围,用来限定资源类的属性取值,增加了RDFS的复杂性,但RDFS仍然是非常简单的,没有多少内容。也因 为此,它的适用面和能力是非常强大的。当然如果要表达更为丰富的语义和推理关系,还需要从规则表达(如OWL和SKOS)和词表(如SKOS、FOAF、 DC等等)两方面进行扩展。任何元数据方案以及本体模式,都是组成语义网标准规范体系中的成员,都是对语义网的贡献。
Tags: OWL, RDFS, 实用语义网, 笔记, 语义Web, 语义技术
下面是看书时随手记下的内容,为了加强印象,特别是看原版书,不记一些东西很快就扔到爪哇国去了。笔记不一定正确,贴在这里供大家批判。

作者: (美) 亨德勒 / (美) 阿利芒ISBN: 9787115193841 页数: 330定 价: 59出版社: 人民邮电出版社装 帧: 平装出版年: 2009-2-1
第 一章 什么是语义万维网
第二章 语义建模
第三章 RDF-语义Web的基础
第四章 语义Web应用架构
感谢远洋老师提供信息,为方便大家观看视频,我已经下载到土豆网,下面嵌入视频也可观看(一年前的在这里):
Tags: TED, 关联数据, 李爵士, 视频, 语义技术
上面视频原作参见 [vimeo.com] (需翻墙,是故转存土豆)。以下翻译文字来自 [www.20ju.com]
以下内容转自台湾林宏泰先生的博客——Library Views,原视频在Youtube上,经过我的审查,并无黄色暴力,转载到土豆上,以飨国内同行。
<林先生博文>
“相信很多人都看過 TED 的影片,這裡的TED指的是Technology、Entertainment、Design,不過現在TED的眾多演講範疇實已超出這三個領域了。美國 有一些圖書館員準備效法,成立一個名為 TEDx Librarians 的網站,講白了就是圖書館員版的TED:
TEDx is a program of local, self-organized events that bring people together to share a TED-like experience.
查看了一下 TEDx Librarian 網站,目前一切都在草創時期,還沒有什麼內容可言,不過還是令人期待。在網站上有分享一個 TED 的影片,內容是 Jay Walker 的演說,可以看看。本站曾介紹過他那令人驚艷的個人圖書館(link), 想必有不同於常人的一些想法。”
</林先生博文>
Tags: TED, 未来图书馆, 林宏泰, 读网
记得当年祝希龄老师给我们上情报检索语言课,用的当然是张琪玉先生的教材。这门课给我印象最深的是:情报检索语言是一种规范的人工语言,应该与自然语言区别开来。这种思想方法在近年来元数据和本体的学习中,一直让我受益匪浅。
最近在看一些本体的东西,想借鉴一下自然语言处理领域长期以来的研究成果,看着看着发现他们走不下去的一个重要原因是忽略了自然语言与人工语言的区别(他们并不是不懂,但却一定要将两者调和,或者说从自然语言中发现可以被形式化的东西),数字图书馆领域一直在搞的本体和元数据,一直想突破基于字词匹配的全文检索而达成基于概念(知识)的检索,一直在开发适用于网络和机器处理的人工语言规则,这条道路我认为是充满希望的康庄大道。
自然语言处理(NLP)的水很深,发展了很多年,规则繁复,成果众多,还跟人工智能有不小的瓜葛,特别是汉语的自然语言处理,其典型应用是机 器翻译。前一阵还跟一位网上偶遇的朋友聊起汉外自动翻译,我认为如果不局限于领域应用,普适的翻译机是开发不出来的。但是据我知道我们有不少科研机构从七 十年代开始就钻牛角尖,浪费了无数科研经费,还在做“无畏”的努力。而领域应用,实际上已经不是单纯的自然语言处理范畴了,例如我们目前积极推进的本体 (包括KOS)、元数据的应用,其目的就在于避开自然语言的弱点,而发明、构建一套人工语言和规则,达成机器对于语义的理解。在这个机器世界里,是不存在 语种差别的,任何语言都被机器理解为符号。这个目标能不能完全实现,能不能建立一套完全形式化的机器语言规则,很好地适用于某些领域,现在还不好说,可能 还有赖于我们当前的努力。
汉语的问题,曾经让汉外翻译系统的研发结结实实地摔跟头的,主要有以下一些(汉语分词问题由于引入了语境、采用穷 尽方法等,目前已经解决得相当不错,就不说了):
1. 汉语同一词类担任多种语法成分且无形态变化;
2. 汉语句子的构造原则与短语的构造原则基本一致;
3. 汉语中的虚词;
4. 汉语的语序;
5. 汉语的书写习惯。
自然语言的机器处理有一个基本假设可能有问 题,这个假设即“语言表达的客观性假设”,即认为语言之所以能够达成交流的目的,是因为关于语言的表达 (包括语义、语法和结构)是客观的,对于客观性的认识能够使我们采用有限的形式 语法组合规则和统计规律,来“变换”、“重构”语言的表达,因此计算机也就能够“理解”“客观的”语言。然而迄今为止的研究似乎证明,语言的客观性是无法 被彻底揭示的。或者我们只能说语言有一定的客观性,但是本质上还是主观的。其客观性表现为人与人之间达成的理解“协议”,这种协议是可以随时变化的。
近 年来由于网络的发展带来语言现象的巨大变化,各种新的“火星语”“符号语”等网络语言层出不穷,老夫子们斥责这些表达不符合汉语习惯,需要规范,但毕竟 语言是活的东西,能够进行交流沟通,就一定会影响目前的语言规范。因此自然语言处理原有的套路(通过穷尽有限的规则来达到机器可处理)越来越不合时宜,应 该从哲学方法论的角度进行大规模的梳理和反省。当然,目前计算机的能力越来越强大,结合网络的发展而形成的巨大的云计算能力,可以支持越来越复杂的穷尽算 法、规则和统计规律,汉语输入法和搜索引擎的发展似乎也印证了这一点,因此如果应用得法,在一段时间内采用传统方法应该也是能够取得一定进展的,但是这种 方法应该看不到最终的解决自然语言机读化问题的希望。
前述5个问题在规范的情报检索系统(IR,或者说数字图书馆系统,或者说应用了本体和元数据 的系统)的开发中只有第一点略有相关,其余都可以绕过。因为概念体系(本体)的架构依赖于自然语言的,基本上只到单词(概念)一级(就是说概念来自于单 词,是对自然语言的规范产生的,是人为指定的概念符号),这一级(字词处理,包括分词和词性标注等)从理论到实践已基本成熟,到更宏观的句法(语法和结构)一级IR基本上与NLP开始分道扬镳了,都是采用“人工”的机器语言(RDF/XML)了,这是自然语言处理与情报检索系统两 个领域在研究对象方面最大的不同。正因为此,在领域应用方面就能够按照比较严格的规范体系来做(至于如何做又是一个大课题,如自顶向下一般是对于新建系统 可行,自底向上进行标注则不可能完全采用人工来做,就需要进行自然语言理解、模式识别或者原有结构的转换映射等方法)。其缺点可能是不够“自然”,即如果 让人直接进行阅读,人性化程度还是要差一点(就如同编程语言由机器语言向高级语言进化,但高级语言也主 要是给机器用的,如果在进行RDF/XML编码转换时能够尽可能应采用软件工具来实现,人性化程度可以高一些)。
上面一大通罗嗦,其实是想说:本体、元数据规则等,其实是(可以看成)一套人工语言规则系统,我们现在应该学习张琪玉先生当初的做法,为网络信息资源的描述和检索,提供一套形式化或半形式化的人工(规范)语言系统(概念体系)和规则,用以规范网络信息资源的管理,建立一套新的知识组织理论(和方法论)体系。或可叫做“元数据方法”或“本体方法”。目前计算语言学研究,就是要从自然语言中发现可被形式化的规则(可以理解为这部分内容只是语言现象的一部分,不可能找到所有的规则,否则就不是“自然”语言了),并对这部分 内容进行“机读化”。从这个角度思考,人工语言应该比对于传统的纯自然语言的形式化处理更为简单,从机器翻译等领域对于语言形式化的研究成果中应该可以找 到大量丰富的养料。
例如以下“计算机语言处理模式”的抽象思考就很有启发:
1、 处理对象(输入)为有限种符号的有限长序列。其中包括如何编码、如何形式化的一整套规则。
2、处理方式(运算)为有限的程序变换。早期采用 简单模式匹配法,后来(至今)采用基于规则的处理方法,近年来流行基于语料库的统计方法。
3、处理结果(输出)为符合新规则的表达 式。
计算语言学研究对象有点像现在的网络世界,在其中寻找规律,或者规范表达(通过语法、 惯用法等),有点像营造一个语义网,只不过网络世界使得人们有了一个工具进行规范(因为有一个前提是:必须机读),而自然语言因为无法规范,才具有无限的 创造力和想象力。上帝的归上帝,凯撒的归凯撒,整个世界才能和谐有序,语言问题的处理才能找到终极方案。
———————————无聊的分 隔符:搞研究是最无聊的——————————
附:以前收集的一个有关机器翻译困境的帖子:
发信人: chris (亦云), 信区: LanguageLogic
标 题: 机器翻译难在哪里
发信站: BBS 曙光站 (Thu Apr 8 14:08:34 1999)
机器翻译难在哪里
做这么多年的机器翻译,感到最大的意外是翻译竟然要调用如 此之深之广之
多层次的知识,而且各个层次的知识彼此如此强烈相关,剪不断,理还乱。
首先,翻译需要彻底的源自然 语言理解以及纯熟的目标自然语言运用,决
不是很多人以为的有一本英汉词典,记住所有英语词法句法规则就可以的。
而深层的自然语言理解则不 得不触及到人类生活的各个层面各个角落,而
且需要浩瀚的背景知识(国外已经有人在谈论语言是知识的海洋)。有的
知识和语种有关,如汉语世 界谈及黄色新闻则会想到“色情”,英语世界
则认为黄色新闻是“那种危言耸听,追求轰动效应的新闻”;有的知识和
语种无关,如:孔子是中国 春秋战国时代的思想家、教育家;乔丹是芝加
哥公牛队的篮球球星;克林顿和莱温斯基有某种关系;邓小平已经去世……
翻 译界常常讨论翻译人员不仅要熟习两种语言,而且要熟知两种文化的差异。
但对计算机来讲,还有大量对人来说不讲自明的知识,如“苹果不能吃人,
只 有人可以吃苹果”;“冬天比夏天冷”;“擀面杖和做饺子有关”这样的
知识。其中绝大部分知识都不是老师教的或书本上讲的,而是我们从小长到
大 所见所闻所感所悟,从具体的到抽象的,从星星点点的到连成体系的。我
们在翻译时不知不觉(偷偷摸摸)调用了这些知识,计算机当然自叹弗如。
请 看:
A. 1979年以前,中国大部分老百姓还没有解决温饱问题。
B. 2500年以前,中国出了一个教育家孔子。
为什 么前者理解为“公元1979年以前”,而后者是“距今2500年以前的那一年”?
常识告诉我们孔老二早已作古。
I can see Peking University tower on the mountain.
为什么翻译成“我在山上能看见北京大学的水塔”而不 是“我能看见山上的
北大水塔”?
去过北大未名湖区的人都知道水塔并不在山上。
妻子晚餐还做了两个丈夫喜欢吃的菜。
为 什么不能理解为“两个丈夫”而是“两个菜”?
在我们这个一夫一妻制的国家里一个妻子不可能有两个丈夫。
演员谢幕时,不要坐着不鼓 掌。
为什么“不要坐着不鼓掌”的主体是观众,不是演员?而“演员谢幕时,不要
站着不鞠躬。”主体是演员?常识告知。
政府 发给她一次性生活补贴。
为什么是“一次性 生活补贴”而不是“一次 性生活 补贴”?常识嘛!性
生活怎么会发给补贴?
等 等,等等。
于是我们也就理解了为什么计算机不能向人那样翻译,它根本不是人类社会生活
的一员嘛!
语音上也能提示 一些消解歧义的信息。当一个老人说“孙子每天教我一点计算机。”
我们知道他不是指战国时代的军事家孙子。因为他读为”sun1 zi4″,而不是”sun1
zi3″。 “1979年以前”读成“一九七九年以前”则很可能是公元1979年;若读
成“一千九百七十九 年以前”则疑为“1979 years ago”。
语言生活在语境里,正如人生活在社会里一样。即使是孤立的一句话,人也是要
给 它造语境,使它有生命。“他今天没有喝酒。”言外之意,他一定经常喝酒。
“在学校一定要听老师的话。”一定是爸爸妈妈送小孩上学时叮嘱的话。英语 也
是一样,“Mr. Smith was a great man.” 言外之意,要么史密斯先生已经去世,
要么他曾经是个伟人,但现在 不是了。
众所周知的信息,我们就不必说了;许多默认的你知我知的知识(公共知识)也不
用显性地字面上表达出来,只有那些新的,不 那么明显的信息,才需要使用语言澄
清。当代世界,语言是用来交流信息的。人们讲究的是语言的时效性,而不是
规范性。在公共汽车里,我们拿 着钱递给售票员说“三个天安门”(”Three tickets
for Tiananmen” rather “Three Tiananmens”)。告诉售票员两个新的信息,(1)
买三张票,(2)目的地是天安门。机器翻译必须把隐性(unsaid)的信息,提升
到 字面上说出来。
因此,我认为,之所以机器翻译如此之难,是因为它涉及到诸多层次知识的调用。
语言是一个多层次交织的系统,这些层 次包括:语法,语义,语境,语音,常识,
专业知识,以及场景和文化背景知识……如果说靠乔姆斯基式的句法知识能够解
决(汉语)40%(这 个数是瞎写的)问题;概念性的知识能够再解决到60%的问题;
剩下的就都是语用知识。因此,机器翻译无法突破, say, 60%,而突破不了60%的
机器翻译是没有什么实用价值的。
出路何在?或许我们应该把大百科全书都输入到计算机里?或许知识的获 取要靠
机器和人,机器和机器,机器和环境相互交流来获得?或许计算机的世界和人类
的世界根本就是两个世界,别指望机器能理解人类社会?
FaceBook上分享的一段Youtube视频,是澳洲同行的一个会议广告,很有宣传效果,由于众所周知的原因,被长城保护起来的同胞们看不到,特此转发。
Tags: vala2010, 数字图书馆, 视频
书社会的Caveman在做一项很实用的研究,问了一个很好的问题(一般而言,回答不上来的问题都是好问题)。我在这里做一些讨论,希望抛砖引玉,批评指正。
在这里把问题归纳为:如何用RDF(及其家族)描述中国朝代的公元纪年。他的朝代与公元纪年对照表在这里:http://tinyurl.com/timeReignChinese。
直感转换方法有很多种,可以用RDF,也可以用SKOS和OWL,甚至其它,包括直接用XML自定义也可以。
编码原则应该是:能复用就复用,看看前人的成果。
而如何编码,哪种方式合用,关键还要看需求。
网络上已经有一些供人使用的转换工具了,但如果要通用性,应该基于RDF进行编码,并开发一个工具,甚至变成语义网络的一种服务,就能够直接为机器理解、获取和使用,能够被其它应用任意调用,就能体现语义技术最大的优越性了。
想到目前国内有些分类法主题词表分别都有了网络版,但那是给人看的,无法通过服务器直接获取术语和术语关系,进行匹配和关系运算,这实际上发挥不了多大的作用。只有用RDF(SKOS或OWL)编码之后,提供一定的语义Web服务(例如用关联数据方式发布),才能真正发挥词表的作用。
这里的核心需求可以整理为:
1、某个朝代有哪些年号,这些年号的起讫日期(即这个对照表:http://tinyurl.com/timeReignChinese)。
2、某个公元年号落在哪个朝代的哪个年号。
3、模糊年号(如不同朝代相同年号)和模糊日期(如起讫年精确到年还是月还是日)的处理。
4a、是否需要提供网络服务接口,实现双向转换;
4b、还是提供代码,嵌入任何应用;
4c、还是仅仅用RDF来描述这个对照表。
5、进一步的,不同朝代的国家情况(地理疆域、并行的国号等)。
就这个对照表的转换而言,可以认为只需满足1、2和4c即可。
简单的解决方案可以这样:
定义朝代(dynasty)类和年号(reign)子类,都属于event类,复用event本体 [motools.sourceforge.net] timeline本体 [motools.sourceforge.net] interval类型)”的rdf描述即可。
将来可以扩展(复用)event的其它属性,例如皇帝,都城,等等。
“庆祝都柏林核心元数据诞生15周年:让元数据工作得更努力些吧!”
2010 都柏林核心元数据应用国际会议(2010年10月20日-22日)暨ASIS&T年会(10月24日-27日)
美国 宾夕法尼亚州 匹兹堡
2010年是都柏林核心元数据提出的第15个年头,DC-2010大会将联袂召开第十届ASIS&T年会。为了更好地总结DC元数据的过去,并展望未来,届时将与往年一样,探讨元数据应用于资源发现的理论和实践问题,并交流新的进展,交换“让元数据工作得更努力”的心得。不仅如此,会议还将回顾近年来元数据领域的最新成果:以“DCMI抽象模型”、已趋完善的“应用纲要”概念和初步成型的“描述集纲要”规 范这三者为代表,标志了元数据对于满足人类信息需求的作用正走向一个转折点。但是现实是不完美的,我们还需要从别人的经验中更多地分享和学习。DC- 2010将总结现状,并着眼未来,进一步拓宽研究和应用的领域,使元数据能够更努力地为满足人类的信息需求而自动地工作。
除了大会的主题外,我们还欢迎就以下元数据专题进行投稿(包括论文,报告和挂图):
论文,报告或者挂图的投稿可通过DCMI同行评议系统提交,网址为:http://dcpapers.dublincore.org/index.php/pubs/。网页设有会议注册及论文提交流程指南(可点击“Information for Authors”链接),以及论文、项目报告或挂图/演示的作者指南。DC-2010的所有投稿都将由大会的国际学术委员会进行专家评审。所有稿件都必须 用英文撰写。被录用的稿件将正式发表于电子版的会议录。若无特殊安排,被录用的论文、项目报告和挂图应该至少由其中一位作者在匹兹堡会议上宣读。
为了稿件能够顺利接收与出版,所有的投稿者需提供自己的基本资料,包括目前的专业职务和联系方式等。
论文(8-10页)论文既可以详细描述创新性的工作,也可以对前述的一些领域性重要进展或者最佳实践进行介绍评议。论文评判标准如下:
项目报告应该简明扼要地介绍一个特定的模型、应用或者活动。项目报告的评判标准如下:
挂图是关于正在进行中的项目或课题研究的展示,或者已完成项目、课题研究的最新结果的展示。挂图建议应当包括一个长为一到两页的摘要。挂图的评判标准如下:
被录用的挂图将会发表在会议论文集并在会议现场展示。除非另有安排,录用的挂图必须至少由一位作者在匹兹堡会议上宣读,并收录到论文集中,并可以进行4-10分钟的视频展示(上传至YouTube中)。会议将会为参会者和作者之间的沟通提供便利。
大会筹备委员会主席:培训委员会主席:
有些缩略语不能只看其表面用词,还需了解具体内容。有两个手边的例子:

图片来自 [en.wikipedia.org]
简单说明:
针对童鞋们经常提问,以及本人根据网络资源和自己的理解整理如下:
开放数据(Open Data):
在网络上可以公开得到的数据,没有任何控制访问的措施(无需登录,否则只能是免费数据或其它名称)。
为了促进开放数据应用,模仿“创作共用”协议,好事者也提出了“开放数据共用协议”。
开放元数据是其中的一类。
项目举例:
关联数据(Linked Data):
一种数据访问(整合)技术,基本上都是以RDF方式表达,对 [Http协议进行少量扩展(规定)而成。低成本,高可用性,整合简单。]
开放链接数据(Linked Open Data)是关联数据的一项运动。
Web3.0:
Web2.0的热衷者或者搅局者提出的一个概念,作为下一代Web的一种趋势探讨,有人说就是语义Web,有人在语义Web基础上添加了P2P、各类无线应用甚至云计算等内容。
语义Web:
现有Web之上的、以数据资源为基本组成单位的Web,这些资源(数据)都标注有元数据描述,从而能够进行语义查询,以及数据整合,提供了互联网上实现语义互操作的技术平台。关联数据可以理解为语义Web的一种实现。
Web of Data是其另一别称。
Web时代东西太复杂就自然被淘汰,有一个著名的KISS原则(大智若愚原则),即Keep It Simple and Stupid,似乎目前Web上的很多东西都符合这个原则,不符合这个原则的东西都死翘翘了。因此联想到DC元数据现在整出三大法宝:抽象模型、应用纲要 (包括互操作级别)和DSP(描述集纲要)未免感到有点前景堪忧。
关于KISS,曾看到一项测试,可以用来作为便捷的衡量方法:
根据这个标准,传统图书馆自动化系统的很多东西,包括图书馆员的很多思路,都要更新换代了!
Tags: KISS, 元数据, 元数据方案
昨天参加了一场博士论文答辩,内容有关语义Web应用,论文架构很庞大,从基本概念、标准规范到元数据和本体的构建,到特定领域应用的实现和查询效果的比较等,感觉该童鞋很不容易。
答辩期间问了两个问题:
1、对于“语义”是如何理解的?机器如何理解语义?是不是Web加了元数据之后就是语义Web了?
2、如何对语义进行编码和查询?为什么没有试验用SAPRQLSPARQL进行查询?
第一个问题是因为论文中罗列了很多语义Web的定义而没有对语义进行定义,更没有说明语义是如何能被机器“理解”,保证机器理解的机制到底是什么?整篇文章给人的感觉好像是对于Web进行了元数据(语义)标注之后就是语义网了。
第二个问题是针对论文认为语义标注必须首先用XML进行结构化,RDF以及KOS转换的本体(OWL)起什么作用都没有明确说明,有点知其然不知其所以然的味道,后面更是没有提到语义Web查询语言SPARQL的独特作用,而是用SQL实现对语义数据的查询。
该 童鞋对于这两个问题的回答还是基本到位的,第一个问题她说到了语义就是所表达内容的含义,需要通过形式化编码才能被机器理解;第二个问题说需要用基于 XML的语义描述语言进行编码,因为在实验系统实现的过程中没有直接支持RDF的数据库系统,所以无法用SPARQL进行语义查询,等等。
这里想补充一些我的认识,有些认识可能比较绝对,对与不对大家可以批评指正。
1、 对于语义Web而言,RDF是基本的编码方式,是不是用了RDF可以作为具不具有明确外在的语义编码的判定标准。就是说,用了RDF,才能说是有语义的, 就像用了ASCII等字符编码标准才能进行文本编码一样。元数据可以不用RDF来表示,但是RDF是专门为了表达元数据而发明的语言(或者说框架或结 构),因为元数据就是“关于数据(主体)的数据(客体)”,主客体通过某种方式(谓词)相联系。这个问题在计算机界一直有争论,但是我这里对RDF的定义 是三元组方式,不一定是XML表达的三元组,也可以是其它方式(如N3等)表达的三元组,或者通过数据库方式能够输出三元组。本体OWL和SKOS都是基 于RDF的,因此它们肯定是表达语义的,而用XML自定义的任何表达方式,可以认为是系统内部局部的语义表达方式,到Web上就不具有可交换性了。因此它 虽然是结构化的,但不是表达全局语义的。
2、RDF是表达机器语义的必要条件,但并不充分。在语义Web中,必须结合URI机制,才能赋予任何一 个表达(资源)的全局语义,当然这个全局也仅仅是对于开放的Web来说的,这也就是URI能够解析的范围。任何一个局域网,无论其规模再大,都可能屏蔽这 种机器语义,而具有其独特的、更丰富的语义。因此,元数据和本体可以适用于比语义Web更广泛的领域,但到了Web上,这些内部语义如果要进行分享、重 用、交换,都有互操作问题。现有的技术架构、模型方案等,都是为了规范和减少这些互操作问题而提出。
3、采用了语义技术,语义Web就可能借助于SKOS或OWL等编码表达的概念体系,进行基于概念的检索,并可能进行知识挖掘和简单推理。SPARQL提供了强大的知识查询能力。
从理解XML到理解RDF,似乎在“思考范式”上要有一个转型。许多搞计算机的人都无法理解,对语义Web认识一直有一个障碍,就是“管它语义不语义,机器懂什么语义?系统只要能满足用户的需求,什么技术不能表达语义?”希望上述解释能够回答这个问题。
Tags: OWL, RDF, 元数据, 语义技术
首先祝大家新年快乐,身体健康!
注:本文中的链接需加入“书社会SNS”并加我为好友才能下载,如有意加入请点击这里。
那边山人常公开了本人的“科研产出报告”,错误不少(重复、遗漏、著作方式不准确等),看来万方的数据库与实际情况还是有点距离。这里全文公开本人今年写的一些东西,算是向朋友们恭贺新年吧!也供大家批评指正(需加我好友才能下载,希谅!)
关注图林后现代讨论多时了(是不是有好事者可以做一个索引,图谋最合适了,只是他太不后现代,恐怕不会感兴趣),驴唇马嘴,一地鸡毛,没看出游园在说什么,倒是雨僧给出点道道。仔细咂摸咂摸还有那么点异味,只是被时不时的禁用词禁用词给污染了,以至于很多人还没有尝到回味,就弃之如敝屣了。
图书馆学研究的诸多现象,有没有后现代性?其实比比皆是,只不过流于一种“无意识”而已,是一种现代性他爸和后现代他表姐乱伦的产物,偶尔还有传统他爷爷 (例如目录学)客串一把3P。这其实可以归结为一种现代中国普遍存在的历史现象,充斥在形而上的文化、艺术、媒体、科学的各个领域,压抑得不到伸张的同 时,魔与道又同时消长。
闻革是贵国现代性最大的策源地,老毛亲手打开潘多拉魔盒,魑魅魍魉在中国上演人类历史上最大规模的先锋派行为艺术表演,后 闻革的三十年则充斥了否定、挣扎、抵赖、回归、超越、反省、抽象、摧毁……,只是因为主体思想的控制而得不到释放,这个跳空缺口必须得到弥补,否 则将一如眼下的振荡下去。
反映在学术领域则是混乱、迷茫、游移、价值崩溃,现代性反叛传统,后现代则一锅端!但是如同附体的鬼混,皮之不存,毛将安 在?后现代永远也不可能成大势。雨僧说得对极:我们向后现代学什么?学怀疑一切,粪土一切,破除一切,没有一切!这的确是认识论上的意义,而不是任何有价 值的学问。在这一点上,比雨僧更盲流的,是竹帛斋,而游园则差太多,特别是读了博士之后。就像Lowie读了OA,就有了英式贵族般的气质,让人高山仰止、恨 不同志,读什么就要像什么,所以基于这一点,衷心诚挚地奉劝游园还是不要趟后现代这个混水罢。
图书馆学当然不可能是后现代的桃花源,但它也决不是后现代的独岛,不可能有独特的后现代问题,所以游园如果一定要献身污泥,妖涤清莲的唯一希望,要么是逃离图书馆学,要么就是成为垃圾。
Tags: 专业评论, 后现代, 游园, 雨僧
12月3日在南京政院上海分院介绍了一次图书馆2.0,因为想秀一下苹果Keynote软件的威力,特别把课件输出了一份mov视频,但是很多朋友还是想要屁屁踢,这里专门输出一份,欢迎下载。
内容基本上是老调重弹(但是还是感到有必要年年讲月月讲天天讲;-),只增加了一些问题的讨论,简列如下,欢迎批评指正。
简单地说,没有。图书馆2.0来自于Web2.0,但已转化为一种新技术推动的理念变革,以及服务升级。Web3.0是万维网新技术的最新发展,目前概念还不统一,包括语义网技术和P2P移动计算等,图书馆可以应用这些新的技术和应用模式,来建设图书馆2.0。
数字图书馆是一个应用领域,偏重于数字资源的管理和服务,2.0技术和应用能够使数字图书馆的服务更加丰富、个性化和人性化,并为数字图书馆提供新的课题。
Library 2.0: Service upgrade to meet the future needs View more presentations from Keven Liu. Tags: 2.0, ppt, 下载, 图书馆2.0, 讲座
张甲老师11月30日上午给我们做了一个非常精彩、前沿而发人深省的报告,不写点感想对不起张老师这次的上海之行。
1、讲了元数据已经不重要,重要性让位于服务,也就是元数据将成为后勤工作。然后又介绍了服务必须要有元数据进行支持(是不是有点矛盾啊?应该套用辩证法:即…又…,就天衣无缝了),并例举了Dialog(看到其中的CA,BA都是靠复杂无比精确无比元数据发财的公司,元数据还是其核心竞争力啊),例举了动态元数据呈现(其实也是多元元数据世界的一个功劳啊)。
2、图书馆面临业务流程的必然变化,图示特别生动。但没有观照我们公共图书馆,而特别观照了学术和高校图书馆,许多变化(例如嵌入研究和教学过程的学科馆员)中外皆然,中科院和清华北大交大都在做。可是作为图书馆事业的主力——公共图书馆还得在黑暗中摸索啊(例如公共图书馆更关心总分馆制下集群系统的管理)。
3、现有的图书馆行业解决方案正在从数据为中心转向服务为中心,系统集成向企业级应用过渡(是不是我总结的:越来越消灭特殊性,倾向一般性了呢?后面的几个系统图示——data warehouse,logical architecture等似乎都很“一般性”)服务为中心的新型系统架构似乎还没有得到业界的共识而标准化,从而使解决方案/模块标准化,但似乎已经有了一定的趋同倾向。
4、普遍提供发现工具看来是共性之一。当然发现一定是基于元数据+协议的,这促成了标准规范的进一步发展,同时促成了内容提供商的合纵连横(各类工具开发商不仅要提供软件系统,同时要帮助图书馆整合资源,这里还牵扯到内容的授权,哈哈,难哪!门槛更高了。两种可能的趋向:1、将来一旦达成标准规范,这类企业的优势顿时荡然无存;2、形成寡头垄断,将来的内容提供商不得不借助于渠道服务商——也就是眼下的这些软件厂商提供服务。哪个方向,目前难说)。
5、松散耦合(decoupled)的系统整合(包括协同服务)成为趋势(其实mashup就是decoupling的一种常见形式)。特别是经历Web2.0的发展,人们普遍重视用户体验和UGC之后,用户都被养刁了!像我们这种永远关起门来成一统,并不许UGC威胁到乌纱帽的环境,是必然被别人远远地甩到中世纪去的了。
6、“容易获得书目数据库服务”似乎在说明,将来的书目数据服务必然是几家寡头垄断的了,大家都不必自己做了,只要购买服务即可。我是同意这个看法的,只是由谁垄断,是不是上游出版书商?或者OCLC之类的嗜利如命的非盈利公司?或者图书馆联合体?抑或是大型图书馆(国图上图等一般都没戏,这是机制决定了的)?可能还有有一番厮杀争夺。
7、介绍美国国会图书馆流程重组的经验颇为耐人寻味(根据学科或语言特长重新分组,打破传统以载体形态加工流程的划分模式,而已内容学科专业的模式—— vertical模式,以及在编目方面的“退缩”)。我们可能会有馆长不同意这种“重组”(例如大大增加拷贝编目人员,从而降低人员专业门槛),以及重组背后的认识。
8、数字资源在图书馆馆藏中的发展速度(比例)以及利用率尽管我们有了充分重视,还是显得增长迅猛,至少是出乎我的预料。当许多馆的数字资源占据馆藏50%以上,而利用率达到纸质资源数倍的时候,馆长们不得不重新考虑馆藏建设理论了。
9、图书馆员的责任:中介(确实,似乎一直是这样说的。张老师引用Rick Luce的话说是“Middle ware”,而我更喜欢用苏格拉底的话“middle wife”,知识的接生婆,帮助读者生产知识。
10、系统框架的变革,张老师对三个阶段的用词比较新颖:传统traditional,过渡transitional,变形transformational。目前处在过渡期,而变形期就意味着像变形金刚一样能够随需而变,这也是新的Web技术架构带来的便利:松散耦合、SaaS、云计算。。。张老师举了一些例子很有启发(有解决方案提供商的,有图书馆方面的:LoC,MIT lib),包括ELS的提法。对于变形后的系统,特别提到了目前的一些项目,如DataNet。虽然这些例子还很不系统,但是颇有启发。
11、最后张老师总结了一个图:“支持图书馆新型服务”,底层是开放的开发平台(包括开源及商用的API),上层是功能独立的图书馆技术支持框架(我的理解就是各种应用模块,可以是独立的软件系统,也可以是自己开发的小插件、小Gadget/Wedget等),而中间分为数据服务、统一资源发现(URD)工具、统一资源管理(URM)工具和读者服务功能模块。
张老师给出的一些建议我虽然不能完全苟同,但感到值得重视和讨论:
1. 避免孤军作战 (Open source -> silo development):当然没错。但张老师似乎不太赞成使用开源,以及开发独立的数据仓储。我觉得对开源可能过于谨慎和低调了,其实张老师赞赏的mashup也是一种开源啊。
2. 在商业软件的基础上构建自己的服务系统:有一个前提,是必须要有合用的商用系统,同时它又允许你做一定的二次开发(即开放大量的API和数据接口)。
3. 只制作变形技术 (transformative technologies):赞同,这也说明将来图书馆所采用的技术门槛并不高,同时图书馆自己的技术部门又不是可有可无的。
4. 系统决策基于事实 (evidence based decision):赞同。我们的许多馆长喜欢拍脑袋,可悲的是这个脑袋有没有经过“科学”的浸泡。
5. 选择注重纵向功能的开发商进行合作:还没感觉。
6. 提供实时信息服务 (deliver information just in time, need evidence):张老师说,这一点比较难。这必须是2.0(例如IM和微博客)所提供的便利吧,所以必须首先大量培养2.0的馆员。
最后张老师发表了名人名言:
图书馆系统人员需要和图书馆员,信息技术专家,信息使用人员,及数据供应商密切联系,创造性地利用信息技术和信息手段,实现图书馆的创新服务。
张老师的报告课件(pdf)在sns.libspace.org上可以下载,如感兴趣,请先点击链接进入注册(这是一个图书馆员交流的社会性网络),在系统“网盘”下可以找到。
Tags: 图书馆自动化, 张甲, 数图技术, 未来, 讲座
能不能告诉我,你最近一次去图书馆是在什么时候?
中学?大学?某次路过?
没关系,不用为没去过图书馆而感到内疚,你可能根本就找不到它。目前在中国每47万个人才有一个公共图书馆。如果你碰巧还有一张“读者证”的话,那么真的要恭喜你了,你属于“百里挑一”:每130个人当中才有一个1。
全民阅读调查统计显示,我国每个识字公民年购书经费约在30-40元,除去教科书教辅书,其中真正购买“图书”的花费不足10元;被调查者自述年阅读图书一般在4-5本。从图书馆方面来统计,全国公共图书馆人均年购书经费0.5元;全国2762个县级以上公共图书馆收藏了4.8亿册图书,人均0.39册;服务了总人口的0.8%,即1062万持卡读者;年借阅图书2.03亿册次(2005年),平均每个读者每年看书19.11本。
而美国,每三个公民就有两个是图书馆的持卡读者,平均每人每年去图书馆7次(年接待人数22亿),图书流通率相当于美国人口的近5倍(14亿册件)。在英国,每一万人就有一所图书馆。
这些数字说明,我国远远算不上一个图书馆大国或者读书大国,但图书馆的读者却都是读书狂人。公共图书馆成了极少一部分自己买不起书,却酷爱读书的公民的乐园,它用了极少的社会投入,获得了极大的社会效益。
与此同时,我们所处的时代又是一个信息泛滥的时代,人们每天一睁眼,就被“信息污染”包围,始终处于“被阅读”、“被轰炸”的状态。书店里坐卧横斜人满为患,地铁里嘻哈一族捧着PSP、手机看小说,“起点中文网”的崛起标志着网络阅读财源滚滚,出版界为Kindle、电纸书而疯狂,手机报正在兴起,3G厂商也已推出多媒体阅读概念……,未被“娱乐至死”的电视媒体所终结的印刷王朝,几乎已经无法在数码网络时代继续苟延残喘。
这一切说明人们并非不喜欢阅读,社会也并非不需要阅读,而是阅读正在转型,阅读也需要重新定义。
在这个过程中,传统的图书馆正在OUT。
数字图书馆正在兴起。
一、数字图书馆:不再有“书”的图书馆
前国家领导人李岚清在1998年10月2日视察国家图书馆时指出:“数字图书馆是图书馆的未来”2。这当然不是他本人的研究成果,而是自上世纪九十年代开始,随着美国国家科学基金会(NSF)、国防部高级研究署(DARPA)和美国航空航天局(NASA)巨额资助数字图书馆研发之后,国内连续数年不断学习、消化、试验、讨论,形成的一定程度上的共识。
然而,对于什么是数字图书馆,可以说至今还没有给出能够得到大家公认的定义,或许我们只能让“数字图书馆”的未来发展自己来定义。
什么不是数字图书馆,倒是得到了一定程度的公认,这种公认与人们的常识有一定距离:通常认为的“数字图书馆”,一般是指印刷的图书经过扫描数字化、变成“电子书”之后,在网上提供在线阅览或下载服务的网站。这恰恰不是“数字图书馆”的主流,至少不是数字图书馆的理想形式,最多只是一种形式而已。计算机科学家甚至认为“数字图书馆”与现在的图书馆没有多少关系,它只是因特网上海量信息的一种结构化存在形式。
不过目前这种“山寨”数字图书馆概念充斥了主流媒体,从而在人们的大脑中形成了认知惯性。这应该都是“图书”这个名称惹的祸。2006年美国OCLC的调查表明,社会大众对于“图书馆”的认知,是与“图书”这种形式紧紧捆绑的,这种捆绑有利有弊,“利”在于赋予了图书馆一种实在、永恒的特性,一想到图书馆,总是巍峨的大厦,无尽的书架和人类所有的知识;“弊”也显而易见,随着传统“图书”的消亡,图书馆也将无可避免地走入历史。数字时代,一切皆有可能。
其实图书馆只是通过“图书”,最终与“知识”达成捆绑。“图书”(包括期刊、报纸等传统纸媒读物)这种载体形态及其所造成的阅读习惯是印刷时代的产物,知识一旦数字化之后,内容与载体就彻底分离,编码与形式得以彼此独立,任何内容、任何媒体,还原为计算机可处理的0和1,一下子就“人人平等”。对于图书馆来说,只是知识的载体形态发生了变化,知识的内容并无发生改变,图书馆收藏、保存、传播知识的职能并未发生变化。
因此,从上世纪九十年代以来,图书馆开始收藏光盘,后来是越来越多的文摘索引数据库和全文数据库,数字媒体在图书馆的采购比例越来越高。目前,国内外一些研究型图书馆采购数字资源的比重最高可达订购经费的80%。由于检索、传递和使用的方便性,数字资源的利用率更是远远超过传统资源。
资源的数字化对图书馆的业务流程和服务方式造成了重大影响,对图书馆员的素质要求和工作内容也产生了巨大变化。一个直接的影响就是,图书馆员必须自己首先具有相当的计算机技能,克服“信息鸿沟”,才能帮助读者,提供必需的服务。目前我们正处于由传统图书馆向数字图书馆过渡的时期,“复合型图书馆”就是为在这个特定时期、传统资源与数字资源混合的业务和管理模式提出的一个新的概念。
“图书”等传统载体形态,随着出版行业的彻底的“数字化”,成为数字化信息内容的一种输出形式。因为将来的绝大多数信息都是“Born Digital” 的,先有数字形式,再有物质形态,而不是相反的先有传统出版,再进行数字化。而且由于传统图书的材料消耗和工艺流程所造成的高额成本(相对于数字拷贝而言),“印刷”将成为一种“贵族”消费。现在的图书必然是将来的“古籍”和艺术品,按需打印的图书也会进入奢侈品的行列。
从另一方面看,电子图书、数字期刊以及手机报纸之类传统出版物的直接“转型”其实只占“数字出版”的很小规模。据报道我国2008年数字出版行业的规模达到530亿元,而50万种电子图书的产值只有区区3亿元规模,9000多种电子期刊也只带来7.6亿元的收入,两者相加刚过10亿元,只占了整个数字产业规模的2%,其趋势看来就是可以忽略不计了。
数字图书馆就像一台大熔炉,所有的数字信息都可以在其中煅烧、冶炼,然后水银泻地一般,通过覆盖世界各个角落的互联网传播开去。大众阅读将彻底碎片化、多媒体化、动态化,任何手持设备都能够显示内容,计算机可以在任何时候, 、任何地点,瞬间将任何内容,在全球范围内,以任何载体、形态、格式和体验传输给任何需要它的“读者”。
这就是未来的数字图书馆。
二、数字图书馆:时势造英雄
与 “图书”捆绑的图书馆最终将会为图书陪葬,与“知识”捆绑的图书馆,才能独立于知识形态和载体的变化,不论信息技术风云变幻,继续实践图书馆“收集保存、有序组织、知识交流、休闲娱乐”的社会职能。图书馆的社会职能可能会随着社会分工变化和替代行业的出现而发生重点的转移,但是无论如何,作为一种保障民众获取知识与信息的公平权利、消除知识鸿沟和信息鸿沟的公益性社会机构,无论是实体的还是虚拟的,纸张的还是数字的,其职能是永恒的。
如果我们把“无纸社会”作为传统媒体向数字媒体过渡的一种象征的话,真正的“无纸社会”只是一个无限逼近的目标。历史上媒体的变迁很少有直接替代的情况发生,更多的是由于功能被新的媒体所替代而造成使用方式和习惯的迁移,老的媒体通常能发掘出新的用途,或者以前的次要功能发展成主要功能。
美国伊利诺伊州大学厄本那—香槟分校的兰开斯特教授分别在1978年和1982年写过两本关于未来图书馆和图书馆员的书3,预言无纸化社会将在上世纪末到来。1999年他老人家对他的预言进行了反省,提醒人们技术的发展会带来对人的忽视。其实技术的发展总有个过程,计算机科学和网络技术一直在向更加人性化的方向发展,可视化、虚拟现实、穿戴电脑等都是近年来最前沿的技术,上世纪七十年代兴起的人工智能研究虽然是失败了,但记载了科学家的努力,Web2.0、语义万维网更是技术以人为本的证明。技术到底还是为人服务的。人的贪婪总是会对技术提出越来越高的要求,归咎于技术,只能是人的无能和无知,也是把技术异化了的表征。有人根据兰老的反省仿佛见证了兰老的愚蠢,认为他的预言的破产就是信息技术的破产,并举例说“无纸社会”实际上用纸更多了。
真是这样吗?预言家们只不过性急了一点,无纸社会尚未到来,但纸张作为一种印刷媒介和信息载体,已经不再具有主流媒体和知识传播的作用,不再具有大众媒体的地位,而逐渐退出历史舞台;取而代之的,数字媒体、网络传播将成为主导方式。
印刷取代手抄,报纸取代公文,电视取代广播,电话取代电报,电邮取代信件……历史上这样的故事发生过多次,但是当前的数字化浪潮恐怕只有印刷术能够相比。我们正在经历一场由信息技术革命带来的人类社会的整体变革。能源、生物、材料和信息四大决定人类未来的发动机中,到目前为止,还只有信息革命率先取得了突破。
目前全球的网民已超过16亿,我国约占五分之一,更有手机上网用户1.55亿4。这个媒体迁移过程,随着我们一两代人的更替,可以自然完成。现在的网络一代,眼不离屏幕,手不离键盘,一天可以泡网十几个小时,出门也不忘带着上网手机。网络就是他们的江湖。对他们而言,任何东西,只要网上没有,就不存在。书本基本上是个负担:书包是每天的负担,买书有金钱的负担,读书更是扼杀青春的负担。偶尔街头买一张小报,或时尚杂志,一般是为了心理需要,或者可以当个坐垫。
如果我们把人类历史的坐标尺度放大,自上世纪下半叶开始的信息技术革命已经是快如闪电了。我们生活在一个一切都按照指数级发展的时代,现代人一年中所获得的信息量,是19世纪一个英国普通人一生所获信息量的总和,而目前每年新增的信息量,又是过去5000年人类信息的总和。历史上还没有哪次新技术革命,能够给人的生活,在一个人有限的一生中带来如此剧烈的变化。
工业文明的印刷技术带来了图书馆的第一次复兴,数字时代必将带来下一次复兴。人类探索世界、追求理性的天性赋予图书馆以基本精神,这些精神随着知识的丰富和理性的进化而不断发展,即存在于图书馆收藏和整理的知识中,也浓缩和积淀于图书馆的精神和理念中,归纳起来,图书馆的基本精神就是知识自由的精神,图书馆的服务理念就是平等无差别和免费服务。现代图书馆的贫民化和开放运动、美国钢铁大王卡内基对公共图书馆的塑造、当前学术领域的开放存取运动等等,这些东西不会随着技术的进步、服务手段的提高以及图书馆形态的变化而变化的。这些理念和精神是永恒的。
这就是现在图书馆行业面临的信息环境,也是数字图书馆应运而生的土壤。图书馆的理念、价值和运作模式独立于它的形态和内容,就像印度图书馆学家阮冈那赞所说的,图书馆是一个不断发展的有机体。其最大特点就是适应性,在任何环境下,都能够调整自己,复制自己,发展自己。
三、数字图书馆:存取人类所有知识
1849年,英国考古学家莱尔德发掘了迄今确知的最早的图书馆——亚述巴尼拔图书馆,发掘出近3万块泥版文书。这座公元前6世纪的图书馆却不是最有名的,只是由于泥版文书的特殊性,使其免于战火,保存至今。而大大有名的,只限于文献记载的、比它晚400年的古埃及亚历山大图书馆,却成了一个永恒的传奇。
以羊皮书和纸莎卷为主要收藏的亚历山大图书馆命多劫难,两次毁于战火,以至于其宏富的收藏和辉煌的历史只能散见于文献,据说其最多时收藏有50万卷各类手稿,是由数百位“誊写员”(当时的图书馆员)日夜不停地抄写得来的。最使这座图书馆文明的是它的收藏理念:穷尽人类的所有知识。
从这一点来讲,Google就是现代的亚历山大图书馆。Google昭告天下的使命是:“整合全球范围的信息,使人人皆可访问并从中受益(To organize the world’s information and make it universally accessible and useful)”,这与2001年2月美国信息技术咨询委员会(PITAC)向布什总统提出的报告《数字图书馆:实现对人类知识的普遍访问(Digital Libraries: Universal Access to Human Knowledge)》如出一辙,甚至可以认为,Google就是在干未来图书馆的活。
Google与图书馆和出版商合作的Google 图书搜索计划目前已提供700万种数字化图书的在线服务5,很快会达到1000万种。这批图书最早来源于五家图书馆:密西根、斯坦福、哈佛、牛津Bodleian四个大学图书馆和纽约公共图书馆,仅这五家图书馆的藏书就高达1500万种。Google打算投资2亿美元,在2014年前完成这个数字化项目,据估计最后可能远远不止。据说人类目前保存的图书总数一共也就1亿种左右6,对于Google来说,把它们全部储存起来似乎不是什么遥不可及的事情。
随着2008年10月Google就其扫描的绝版书与美国出版商协会和美国作家协会达成赔偿1.25亿美元的和解协议,Google几乎就是拿到了合法的扫描人类所有图书的执照。即便该和解协议覆盖范围极其有限,这个模式也为将来处理同类纠纷提供了参考。当然没有多少人能够出得起Google开出的价码。Google建立了一个无比巨大的图书分销零售平台,凭借其所向披靡的搜索引擎和其它技术优势,将内容重新标注、索引、组合,并扩展到期刊、报告、会议录等传统学术出版产业中,甚至可以进一步与新闻、多媒体行业进行整合,而在整个内容产业中攻城略地,依靠其平台和商务模式,左右整个内容产业链。
现在Google的战略布局虽然初现端倪,已经很难有实质性抵抗了。由Internet Archive、微软、雅虎等组成的开放内容联盟曾经也想在这个领域分一杯羹,但在扫描了75万册图书之后,微软还是放弃了该计划。当初微软的决策似乎是出于与Google竞争的冲动,与Internet Archive的合作也使其变成纯粹烧钱商务模式。其它类似的数字化项目还有中美百万册图书计划、古登堡数字图书馆计划和美利坚记忆数字图书馆项目等,从规模上和技术上不能跟Google图书搜索计划相比,只能算是实验性或示范性项目。
当然一家通吃的局面是很难出现的,亚马逊公司凭借其Kindle阅读器一鸣惊人,通过终端的标准化,打通整个产业链,打造出一个电子书零售市场,其商务模式有模仿苹果公司itune/ipod之嫌,但依然取得了巨大的成功。该领域还有Sony等公司加入战团,实力不可小觑。
与 “数字内容”的生产、组织、发布、服务相关的公司还有一类,就是像“盛大起点网”这种原生数字内容平台公司,他们与传统出版行业的竞争看起来是最激烈的,互相渗透,抢夺地盘,但是这个战场最多只是局域性的,而且其商务模式目光短浅,很难打造起真正的行业平台。真正具有战略意义的,能够左右整个数字内容产业的应该是Google、亚马逊这类野心和实力并举、掌握了各类数字内容分销平台和渠道的公司。
图书馆在这场大战中尽可以采取坐山观虎斗的策略,谁赢谁输都没有坏处,行业整合了、科技进步了,图书馆可以更好地实现其固有的职能。要知道任何企业都是有其生命周期的,据说目前存世的最长寿的企业,是传了40代,已有1400多年历史的日本大阪寺庙建筑企业金刚组,西方最古老的企业为法国葡萄酒世家Château de Goulaine,已超过千岁了。然而正如前文所述,图书馆至少已有2600多年的历史,再强大的企业,存续再久的企业,也无法跟一项公益性的事业相比,尽管可能干了与图书馆相同的工作。
图书馆作为知识中介的功能,可能会被商业化的服务逐步取代,然而图书馆作为保障知识自由和平等获取的机构,其真正覆盖的应该是无法获得商业化服务的人群,任何时代都有这样的人群,以逐利为目的的企业总有服务的盲区。另外,图书馆尚有“保存、组织、交流、娱乐”四大职能,是任何私有企业无法完全覆盖的。
数字图书馆的前景风光无限。
四、未来的图书馆:随需而变,无所不在
图书馆事业的不可取代性,并不是图书馆可以不思进取的理由。行业的兴衰成败,背后可能的原因比企业的开停并转要复杂很多,但并不是没有前车之鉴。图书馆不管有多少职能,只要不能继续吸引读者,它的前景就堪忧。因此图书馆面临的挑战还是十分巨大的。
建设数字图书馆并非不要场地,不要空间。自古以来,图书馆都是人们交际聚会的场所,近年来更有“城市的起居室”、“市民的书房”等称谓。数字图书馆只是指它的资源是数字化的,设施是围绕数字化资源所配备的,从功能上说,它依旧是城市或社区的信息中心。
图书馆发展“信息共享空间”和“学习共享空间”,甚至“Idea Shop”,正在成为公共图书馆和高校图书馆的潮流。你如果去一个社区图书馆,可能看不到成排的书架、报栏,倒是有不少沙发、茶几,以及零星的电脑和散落各处。这种 “共享空间”的理念就是,综合图书馆的各种资源、设施和能力,以人为本,向读者提供所有可能的服务。每一个“共享空间”可能都是个性化的,就像每一所星巴克的布局都不一样,但他们提供的服务和体验是一样的。
将来你可能会见到环境优雅,音乐幽幽,提供咖啡茶点,可以免费上网的社区图书馆;或者接受专题资料预约,提供投影等会议设施,到处都能无线上网的图书馆阅览室供您在需要的时段使用;如果需要专业的参考馆员陪伴协助,也可以预约。
当前制约图书馆提供数字资源服务的还有一个重要障碍,就是版权。传统图书馆提供纸本图书、期刊和其它馆藏资源的借阅、复印,有行业规范(例如每次复印不超过一本书的三分之一之类),属于“合理使用”范围。但数字资源由于拷贝和传播的便利性,一下子就无法“合理使用”了,许多限制不能充分发挥数字资源的优势,使得许多公共图书馆在数字资源的服务和提供方面十分被动,利用率很低。
图书馆的存在本来就是对于版权制度的一种调节和弥补,是平等获取知识的一种保障。从经济价值上来考量,目前图书馆购买力大约能够占到全部出版市场的5%左右,虽然不是举足轻重,也能算相当可观。本来这一部分投入就是应用于没有能力购买出版品的广大“长尾”读者,他们是出版市场的无效用户,这些没有市场价值的用户的阅读需求由图书馆这种制度设计来满足,公共资金(或捐助资金)购买的资源或服务实际上对于出版市场来说是额外的收入。
数字出版其实也是如此,当然长尾用户的需求不一定通过图书馆来满足,但是图书馆肯定是一个拾遗补缺的、不可替代的渠道。对于如果数字资源不能通过公共图书馆进行提供,其就会丧失保障信息获取自由的职能,走向“博物馆化”就是个时间问题了。对于研究型图书馆和大学图书馆来说,一般对于开放存取具有本能的冲动,因为本身其所属机构就是学术出版的最大生产者,自己生产的知识,再通过商人的渠道,附加很多利润,再卖给自己,本身的商务模式就有许多荒谬之处,这些机构的联合所形成的购买力也是一个谈判筹码。相信进过不屑的努力,图书馆在数字资源的合理使用方面能够探索一些新的模式。
大学图书馆和研究型图书馆在向数字图书馆的过渡方面更有积极性,欧美国家已经认识到图书馆在数字时代亦然是教育和科研的基础设施,因此花巨资研究数字仓储、数字资源的保存、组织和利用问题。数字图书馆通常有两张面孔,除了现实中的古典庄重巍峨的大厦之外,通常在虚拟世界里也具有“课件中心”、“数据中心”、 “学术信息中心”及“交流中心”等职能。无纸图书馆(E-Only)将在这两类图书馆中率先实现。不仅如此,这类数字图书馆将利用各种技术,将资源入口和服务“嵌入”到用户(通常是教授、研究人员和学生)的信息环境中(例如做成桌面工具、浏览器插件、工具条等),从而更加虚拟化而真正“无所不在”。
十年内可以弯折的电子纸应该能够得到商用,电子墨水技术在灰度级别和色彩深度方面已经能够超出普通人的需求,翻转速度能够应用于基本的视频播放。“电子书包”(即存储有所有教科书和教辅书的可写电脑)的普及可能会更快一些,电子书会也像MP3一样大行其道,这些载体在感官舒适度方面甚至会超过目前的普通纸张。所有这些变化将给新闻和出版行业全盘数字化提供巨大的市场动力,人们获取新闻和学习知识的习惯也会发生重大变化。
图书馆作为一种实体空间的作用和作为一种虚拟知识传播机构的功能将会彻底分开,实体机构的图书馆依旧作为公民知识生活的中心,而虚拟的知识传播通过各类渠道和设备(例如利用无所不在的“云计算”环境)而变得“泛在”,图书馆通过网络提供大量的信息服务,但是你可能丝毫都感觉不到它的存在。
由于数字化造成的媒体融合,许多大型的图书馆或图书馆联盟同时会扮演出版商和资源服务商的角色,向产业上下游同时挺进,特别是那些有独特资源或者能够提供深度信息咨询服务的图书馆(如议会图书馆和研究型图书馆等),一方面成为知识的出版者和发布者,另一方面依靠新型电子报纸、电子书或手持设备,提供更为专指的内容分发业务,因而也可能兼具一定的媒体角色,但是这类图书馆可能为数很少。
图书馆行业现在正处于历史上独一无二的阶段,原先的产业链已经松动、断裂,新的链条尚未建立、成型。图书馆在社会中所承担的职能虽然没有本质的变化,但角色已经发生了重大变化,图书馆不再仅仅是伫立于街角等待别人上门的一栋大楼或者几个房间,而是人们电脑桌面的一个icon,手机上的几个应用,kindle上的一个帐号,等等。图书馆的服务流程与人们的学习生活密切相关,同时图书馆事业作为一个整体,依旧支撑着人类所有的知识记忆。
结语
英国哲学家波普尔曾经做过一个著名的“思想实验”:如果地球遭到毁灭,我们可以依靠图书馆中保存的人类记忆,花费一两代人的时间,重建整个人类的文明。而如果图书馆也遭到毁灭了,人类将重新进入一个漫长的文明重建时期。我由此推理,由于数字图书馆的存在,我们重建人类文明的时间将大大缩短,甚至就像恢复备份一样容易。
Tags: 图书馆未来, 数字图书馆, 未来的图书馆
今天参加第八次数字图书馆建设与服务联席会议,做了一个汇报,文件上载在这里,供有兴趣的同行朋友下载。
许多领导专家提出了很多修改意见,这个汇报仅供参考,将来的文档会修改很多。
下面这个是keynote版本,另有一个pdf版在这里,点击即可下载。
数字图书馆安全管理 View more presentations from Keven Liu. Tags: 下载, 专业评论, 会议, 安全政策, 数字图书馆, 联席会议
当前图书馆建立法人治理结构,作为事业单位改革的一种尝试,似乎并没有可以借鉴的模式。深圳起步较早,但除了 人事制度,没见最终结果,其它也有省市听说在试点,但似乎方案还没有深圳这么明确、完整。国外的情况(公共图书馆的基本运行方式)我们当然是知道的,但是大环境不同,基本是学不来、不能学的。
为什么要改?我的理解是计划经济体制下生长起来的“事业单位”体制现在已经不适应国家宏观管理的需要了,必须建立适应市场经济的新制度和规则,市场经济是法制经济,目前许多事业单位的建立和运行都缺乏法理基础,其目标、效率、考核、监督都缺乏机制。包袱越来越大,效果越来越差。
这里头就带出一个根本问题:图书馆的法律地位问题,这才是我们真正需要一部《公共图书馆法》的地方,只有明确了公共图书馆的公益属性和依法服务的独立的法律地位,其“法人治理结构”才有法可依,有据可行。
建 立法人治理结构的想法几乎完全是从现代企业制度改革模仿而来,试图通过利益相关人的博弈,所有权经营权管理权监督权分开,分清责任,明确关系,加强考核, 调动资源,达到一种平衡,并促进事业可持续发展。具体形式则是成立理事会或管委会,赋予一定的权限和责任,使其对图书馆的运营进行周期性的监督、绩效 评估、方向指导、咨询,甚至赋予考核、预算、分配、资源调度或重大事项审批以及人员任免职能等等。
目前有一种单纯模仿国有企业国资管理模式的倾向,比如以国有资产增值保值为目标的“管委会”制度,仅仅由财产管理的“利益相关”人组成理事会的方式,这 种方式与图书馆为大众服务,提供知识保障,服务教育、科研、经济建设和城市发展,满足群众文化消费等的根本目标和需求是不相符合的。如果制度无法保证基本目标的实现,和对实现效果、效率的考核,这样的制度是不尽合理的。图书馆的增值保值如何做?图书馆的财产如何衡量?实际上并无定论,如果从图书馆流通的图书 或财产来看,每年有一定的损耗是必须,越损耗越说明利用率高,贡献大,作用显著。而且如果允许以珍本、善本、特藏的市场拍卖价格计算,或者以图书馆的无形 资产、品牌价值、知识产权等计入财产,图书馆的增值保值应该是毫无问题的。试想,如果翁氏藏书或盛宣怀档案五年之内价格翻了十倍,难道要给管理层十倍的奖 金不成?
新的机制如何建立,理事会有多少职能,管理层有多大权限,还是要看如何更有利于促进事业发展,如何能调动各方积极性。这需要在制度设计细节上下足功夫,做好调研,真正保证“相关利益人”的权利。不 能简单地认为社会名流、读者用户、业界专家、工会委员等不代表资产,因此就不能进入理事会;也不应轻率地把管理层摒弃在理事会之外,否则理事会不会真正关 心图书馆的运作,或者难以真正将理事会的决策或咨询意见,贯彻到图书馆的业务和服务工作中去。如何把握尺度,可能要允许在实践中摸索、调整,有一个试验 期。
Tags: 专业评论, 公共图书馆, 改革, 法人治理结构