365key.com
发现·保存·分享@天天网摘

Q版365key  设为首页 加为收藏 帮助

 首页  网址  添加  我的网摘  我的订阅  最新网摘  收录榜  点击榜  同好  配置  工具箱  标签  兴趣小组 
  IT168 |  华军下载 |  猫扑 |  VeryCD |  CSDN技术 |  DoNews |  9Flash |  中金 |  游侠 |  股票天下 |  游戏公会 |  电子工程 |  白银时代 |  和365Key合作

dvdlkdvd的网摘列表 RSS格式输出  365Key邮件订阅,每天可以定期收到邮件通知  使用 POTU 订阅
搜索词: 时间:
分类:     排序:
 
刷新列表 共1页、27项网摘
blog中文翻译 ?超越用户创建的模式:Web 2.0 和语义网络点击:72
 分类:web2.0; 开发模式; Semantic_Web 时间:2006-12-24 20:30:11 dvdlkdvd收录 (还有3人收录) 复制到我的网摘
用户创建软件:软件自己可以智能的创建应用和完成任务。

由最终用户所驱动开发的产品,例如 QEDWiki,最终用户将自己来执行,并不是所有的软件集成都要通过那些永无止境的手工重新输入或者是拷贝粘贴数据来完成。这一切都意味着:

1)有需求的存在,但不足以被人们精确的表达出来用作软件的设计
2)在我们日常使用的那些软件之间有一种非常松散的整合(功能不会过度耦合)

事实上,的确有至少两种方式的语义网络技术,可以被我们用来改进 Internet 的使用方式。第一种是提供一个语义描述上的“层”;在它里面的服务和内容能够清晰表达给程序,而不是给开发人员。第二点是积极的使用这个“层”;让用户自 己来构建软件或者是智能的执行它里面所提供的过程。



使用那些潜在的“日常软件(例如通用的邮件服务、日程管理等等)”来组合成可以连贯执行的应用已不再是梦想,在这里过程(可以被程序智能感知的逻 辑接口)也是需要被管理的,而不仅仅是数据。

我把这种形式的应用理解为能够利用集体智慧进行重组和自我组装的软件,毫无疑问这是一种前卫的软件开发形式,许多公司已经开始进入这个领域。那些初创的公司例如 JackBe, Teqlo, OpenKapow, Itensil 和其他参与者的已经完全的或者是部分的支持自动化的软件创建和过程管理。有趣的是,他们并没有使用真正的语义网络技术,而是通过那些开放的、简单的、容易理解和描述的 Web 2.0 时代的服务来实现的。

现在是我的最后一个观点。在今年的早些时候我和 Adam Bosworth 还有一些其他的 Web 传教士们,答复了一个听众关于 Web 2.0 和语义网络之间的区别的问题,“Web 2.0 是语义网络的初级阶段”。这里有一个有趣的问题,最新一代的工具似乎是建立在简单的私有的方式之上的,而不是利用那些正式开放的语义网络技术。这是否会影 响到语义网络 1.0 的可用性还很难说,但至少 RSS 1.0 已经被广泛采用了。所以我把这称之为新一代的“务实语义网络”。但我有点担心缺乏标准的支持,不过这种下一代的在线软件是否能够展翅高飞我们将拭目以待。

http://chn.blogbeta.com/256.html
challenge.semanticweb.org点击:10
 分类:Semantic_Web 时间:2006-9-23 23:26:29 dvdlkdvd收录 复制到我的网摘
Winners of Challenge 2005!
1. Prize: CONFOTO, appmosphere web applications, Germany
2. Prize: FungalWeb, Concordia University, Canada
3. Prize: Personal Publication Reader, Uni Hannover, TU Vienna, Lixto Software GmbH
http://challenge.semanticweb.org/
UUZone - 我blog故我在--语义网的成功需要彼此协作点击:33
 分类:web2.0; Semantic_Web 时间:2006-9-23 21:25:15 dvdlkdvd收录 复制到我的网摘
05年semantic challange最佳语义网应用的得主之一CONFOTO(http://www.confoto.org)或者可以为语义网的初步应用提供一种简单的感性认识。我们知道,Flickr是web2.0时代一种非常流行的在线照片网站,它采用加标签的方式,用户可以自己为自己的照片增加任意的标签,而通过这些标签的共享,方便了照片在用户间的共享,目前这种技术已经被web2.0网站广泛地应用,英语中,一个新被构造出地词“folksonomies”被用来特指这种技术或者现象,指多个人通过共享元数据而形成社会网络。但是,标签在功能上毕竟有其限制,例如,你的“Berners-Lee”标签和我的 “互联网之父”标签,仍然是两个独立的标签,如果不加额外的语义理解,就不能把它们俩认为是同一个标签。但是,仅仅增加“词典”也还是不够的,重要的是将不同网站的也“标签”连接起来,所以各网站应该以标准的数据格式,统一的或者能够互操作的“词典”、或更强大的“本体”来表示背后的语义数据。在 CONFOTO中,用户可以直接对照片进行RDF语义标注,并相应的进行语义浏览和查询。

但是,大规模RDF Triple Store的效率和性能、本体的一致性等问题还是目前人们对语义网技术的担心所在。
http://www.uuzone.com/blog/mao/135801.htm
Berners-Lee:语义网的成功需要彼此协作 - 桂林山水甲天下 - 博客园点击:33
 分类:Semantic_Web 时间:2006-9-23 21:21:23 dvdlkdvd收录 (还有1人收录) 复制到我的网摘
概念好说,可是数据格式的统一可能会比较困难。本体虽好,但要想覆盖所有信息,做到全面权威短期内是不可能的。
另外一点,如何对历史数据语义化。新的数据使用新的规范没问题。可现在大量的历史信息怎么办?如何语义化?谁来做这个工作?
只有协作才能促进语义网。近日,Berners-Lee在英国Southampton大学的一个会议上说,构建语义网所需要的全部就是将现在的各网站数据库内部内容以标准的格式向外部开放。语义网的力量不是单个的数据源可以呈现的,只有当多个数据源连接在一起时,语义网的强大力量才可以有所体现。Berners-Lee举例说,

“Taking photos of the audience with a digital camera, Berners-Lee explained that while the camera he was using didn't have any GPS capability, it still recorded the time and date when each picture was taken. Combining this with data from his calendar, which contained details of the conference, would allow a computer to infer where the picture was taken and add this information to the photo's metadata. ”

将DC 里面的照片基本信息同web上自己的Calendar信息连接在一起,计算机就可以得出具体的照片拍摄时的情况,从而可以作为照片的元数据存储起来,供以后进一步的查询,当你再一次根据会议情况查询照片信息时,你所查询的就不单独是照片或者单独calendar网站的内容,而是一种一般的semantic web内容了。

要实现这些,就得要求各网站使用标准的数据格式,现在w3c的语义网数据标准是RDF。而且,现在的语义网也提供有相应的技术与工具,能够动态生成RDF,就好比如今的网站内容管理系统能够动态生成HTML页面一样。

基本的技术壁垒不是最重要的,重要的是各网站彼此的协作。“The Semantic Web Needs You!”,另外一个语义网大牛Jim Hendler在今年的ASWC第一次大会报告上也说,Semantic Web就像当初的Web,只有各种站点多起来,并连接起来之后,才够成了今天强大的Web。Jim Hendler甚至将它比喻成中国的古长城,对语义网来说,Linking & Cooperation是至关重要的。

05年 semantic challange最佳语义网应用的得主之一CONFOTO(http://www.confoto.org)或者可以为语义网的初步应用提供一种简单的感性认识。我们知道,Flickr是web2.0时代一种非常流行的在线照片网站,它采用加标签的方式,用户可以自己为自己的照片增加任意的标签,而通过这些标签的共享,方便了照片在用户间的共享,目前这种技术已经被web2.0网站广泛地应用,英语中,一个新被构造出地词“folksonomies”被用来特指这种技术或者现象,指多个人通过共享元数据而形成社会网络。但是,标签在功能上毕竟有其限制,例如,你的“Berners-Lee”标签和我的 “互联网之父”标签,仍然是两个独立的标签,如果不加额外的语义理解,就不能把它们俩认为是同一个标签。但是,仅仅增加“词典”也还是不够的,重要的是将不同网站的也“标签”连接起来,所以各网站应该以标准的数据格式,统一的或者能够互操作的“词典”、或更强大的“本体”来表示背后的语义数据。在 CONFOTO中,用户可以直接对照片进行RDF语义标注,并相应的进行语义浏览和查询。

但是,大规模RDF Triple Store的效率和性能、本体的一致性等问题还是目前人们对语义网技术的担心所在。
http://www.cnblogs.com/Jacquette/archive/2006/09/20/semanticweb060920.html
Keven’s Blog 数图研究 ?关于tag和folksonomy的进一步思考点击:46
 分类:Semantic_Web; tag; rdf; Microformats 时间:2006-9-22 14:06:31 dvdlkdvd收录 (还有1人收录) 复制到我的网摘
“用户-资源-标签”是一组联系,可以用一组RDF复合语句形式化描述。
标签的价值来源于其社会属性:用户(不论是作者还是读者)为自己而作,很大程度上避免了滥用,产生了价值。
用户和用户之间的关系有一大堆属性,可以通过FOAF、hCard等显示化描述、获取。
资源和资源之间的关系有一大堆属性,表现为DC、MARC元数据描述记录。
各类具体应用中用户、资源、标签之间及相互关系如何外显化表达,是一个问题。采用元数据是一种方法,必须付出时间成本(制订),必须在一定的框架机制下(如Microformat)实施。PageRank等揭示内部关联和结构的算法也是一种方法。可能还有许多未知的内在关联有待发现。
利用资源之间的属性关系作用于用户,可使用户由资源而聚类和建立社会性网络。例如使用同一/同类资源的用户形成社区。
利用用户之间的关系可以作用于资源,可验证、强化资源的聚类和建立社会性网络,向相关用户推荐资源。
只有共享的标签(标签的社会化)才能形成folksonomy。
标签是如何社会化的?标签的处理流程是一个去个性化过程,目前利用民俗分类法的各大网站是如何处理和利用的?
标签是否应建立起其相互之间的关系?如何建立?能否利用资源和用户及其关系自动建立标签之间的关系?
一个系统中用户可能分多种角色,例如作者(内容创建者)、读者甚至标引人员(图书馆员),区分他们的标签(例如赋予不同的权重)也常常是很有意义的。
不同的标签体系(各网站)能否共享folksonomy?如何共享?
http://my.donews.com/keven/2006/09/18/evpwqnhkwhcscpotwrzbvhzeveaeoesnitlf/
试论叙词表与本体(ontology)的异同点击:25
 分类:ontology; Semantic_Web 时间:2006-9-22 14:05:01 dvdlkdvd收录 复制到我的网摘
Keven老师的意见:
这种理解不是很确切

叙词表可以看成是一种本体,其中许多概念影响着今天的形式化的本体,当然形式化的本体还受到描述逻辑以及置标语言的众多约束。
1、本体完全可以是严格规范的科学术语,例如完全可以用OWL来表达汉语主题词表,甚至用OWL表达汉语主题词表将更加严格,必须明确许多作为“机读”而不是“人读”的明确界定。
2、叙词表的用代属分参关系本身就是一种层次+网状关系。
3、本体由形形色色的本体,就这句话来说对本体的希望未免过高了一些,当然本体的前途未可限量。叙词表维护和使用的人工成本很高,它的发展方向必然是本体。
4、5、6都是细节问题,不值一提。
1、叙词表的概念与应用特点   叙词表又称为主题词表,它是一种语义词典,由术语及术语之间的各种关系组成,能反映某学科领域的语义相关概念。ANSI Thesaurus标准(Z39.19-1980)规定有13种词汇间关系。这13种关系完全包括了中国《汉语主题词表》的"用、代、属、分、参"结构。   叙词表主要用于检索时的后控制和标引时的自动或辅助选择索引词,是提高查全率和查准率、实现多语种检索和智能化概念检索的的重要途径。   2、本体的概念和应用特点   本体(以下统称ontology)是一个关于一些主题的清晰规范的说明。它是一个规范的、已经得到公认的描述,它包含词表(或称名称表、术语表),词表中的牾语全是与某一学科领域相关的,词表中的逻辑声明全部是用来描述那些术语的含义和术语间关系的(它们是怎样和其它术语相关联的)。因此,ontology提供了一个用来表达和交流某些主题知识的词表,还包括一个关系集,关系集把握着词表中这些术语间的联系。   3、叙词表与ontology的区别联系   (1)叙词表中的牾语均是规范的科学语言,而ontology中的概念、术语可以用自然语言和半自然语言来表达。这是两者在逻辑表达形式上的区别。   (2)在组织结构上,叙词表中知识点的分布是线性的、一维的。而ontology中的知识点/概念分布是网状的,它不单纯是一张平面的网格,而是一个在四维空间中伸缩的网状结构。   (3)Ontology是一个开放集成的体系,它的底层知识库与概念集可以随着学科领域的更新和发展随时进行修正和更新,在这一点上,叙词表则"望尘莫及"。利用ontology动态更新的特点,可以找出学科发展的规律。   (4)叙词表中只包含"用、代、属、分、参、族"这样的简单的语义关系[9~11]。而ontology中概念间的关系,则被描述得更为广泛、深入、细致和全面。这是两者的最主要区别,也是为什么基于ontology的系统可以实现语义检索和半自然语言、乃至自然语言检索功能的奥妙所在。基本说来,ontology中概念间的关系分为六种:①A synonym B;②A hypernym B;③ A hyponym B ;④A overlaps B ;⑤ A disjoint B ;⑥ B, C, D cover A。   (5)叙词表是一个词汇库(语料库)但不是知识库,而ontology不仅仅是概念集、语料库,还可以是一个知识库。一个实际存在的ontology可以是一个自备知识库或知识底层的完备的知识组织体系,具有智能查询、回答用户问题、机器翻译和预测知识增长点等等传统的基于叙词表的检索系统不具备的功能。   (6)叙词表相对稳定,结构保守而单一;不可能经常修订。而ontology的结构应该是一个基于XML的开放体系[13],可以被复用,可以增加或减少枝节,可以对每个枝节处进行修改和校验,可以对原有的模式进行保存。   而且,将概念内容掏空后的框架skeleton又可以用作其它领域本体(Domain ontology)的框架(Framework)。譬如,花卉学本体一旦构建完成,如果将其中的木本植物分类部分去掉,就变成为"草本花卉本体";如果将植物分类树的其它不属于观赏植物的部分添加完整,那么就可以成为一个完整的植物学本体;再将植物学本体推而广之,添加上分类体系框架相同的微生物学和动物学的知识与术语词汇,就会成为完整的宏观生物学本体。   4、结语   由于目前,大量的工作必需依赖手工的录入和标引,机器标引和自动编目存在很大的局限性,其精确性尚无法和手工标引媲美。低效率的曛工标引成为制约ontology系统构建和完善更新的最大瓶颈。而且研究ontology构建的技术体系与研究检索的技术体系之间存在脱节问题。这导致了ontology工程的生命周期不能顺利进行。Ontology的应用有着非常广阔的前景,而针对ontology工程的生命周期,进行自动标引、自动的信息抽提、信息更新和数据挖掘等智能代理技术已然成为ontology研究的焦点核心。
http://boole.cs.iastate.edu/semanticweb/view.cgi?forum=29
semantic mediawiki点击:11
 分类:Semantic_Web 时间:2006-6-29 23:09:55 dvdlkdvd收录 复制到我的网摘
semantic mediawiki
http://wiki.ontoworld.org/index.php/Main_Page
博客园 - Jacquette - Bootstrapping Semantic Web 语义网的引导(1)点击:41
 分类:Semantic_Web; Microformats; RSS 时间:2006-6-28 8:39:29 dvdlkdvd收录 复制到我的网摘
语义标记:RSS,XHTML,Microformat,GRDDL
有了XHTML,那么如何将XHTML中的XML文档转换为RDF文档的呢?GRDDL就起这个作用,它的全称是Gleaning Resource Descriptions from Dialects of Languages ,直观的理解就是你可以从纯HTML的文档中获取RDF文档。假如像这样的规范和处理工具成熟起来,RDF数据源就将铺天盖地了。
http://jacquette.cnblogs.com/archive/2006/01/11/bootstrappingSW.html
Keven’s Blog 数图研究 ?关于语义Web的一些解释点击:41
 分类:web2.0; Semantic_Web; Microformats 时间:2006-6-21 13:27:12 dvdlkdvd收录 (还有2人收录) 复制到我的网摘
值得仔细一读 尤其是对SW的特征解释的非常清晰
目前的Web应用所传送的代码实际上已经远远超越了HTML文本,虽然显示给人的只有其中的html部分(或者通过CSS/XSL等方式动态生成的HTML),许多机器代码或具有特殊语义的代码(例如许多微格式)都需要浏览器插件或其他方式(ajax)进行处理,方能获取。RSS、FOAF、hCard、hCalendar以及许多格式都是一些特殊用途的XML/XHTML代码,需要本地支持(通常可以通过js、jsp、asp、ajax开发的浏览器插件,如greasemonkey或其他客户端代码),而且这些开发最好是基于标准的,这样才便于共享、使用、推广,但是标准的建立不是一簇而就的,除了技术因素之外,遵循开放精神、尊重现有标准、由应用推动等都是其中的因素。


SW的特征并不在于是否进行了属性描述,关键问题在于这种属性描述是否能够被机器识别,即你描述的”title”、”creator”等别的机器也要看得懂,或者知道你的”title”、”creator”就是他的”heading”、”author”,甚至知道你所参照的”creator=keven”就是指” http://my.donews.com/keven/”中的那个keven。
机器实际上是不可能”知道”语义的,机器对于语义的判断仅仅是”一致性”判断,不同来源的东西具有相同的URI,就认为是相同的,不同东西如果用isVersionOf, isPartOf等等,就指明了它们的语义关系。

由此可见,是不是SW的特征主要还是后台的:是否支持一种机器认可的语义编码(即RDF)以及是否建立形式化的语义关系(即利用OWL等本体语言)。
http://my.donews.com/keven/2006/04/28/explainsw/
Keven’s Blog 数图研究 ?论题的由来点击:29
 分类:Semantic_Web; 互操作 时间:2006-6-13 9:54:33 dvdlkdvd收录 复制到我的网摘
“语义”通常是指“信息的含义”。互联网不仅是无数台服务器、信息设备的联合体,更可以看作是一个庞大的信息资源的联合体。从抽象意义上来看,这个联合体实际上是一个巨大的符号系统,由无数的语法、语用和语义规则联结而成。从具体的组成来看,这个联合体是由无数自治的信息体和功能体组成,每个相对独立的信息体就是一个数字图书馆。对于作为信息体的数字图书馆而言,“语义”和基于语义而实现的功能是其存在的目的和价值所在,所有的语法规则(各类协议、结构、约束等)和语用信息都是为了组织和传播语义而存在的。

“互操作性”指不同系统平台或编程语言之间交换和共享数据的能力。互操作解决信息系统之间的“异构”问题。不同的数据库形式和结构、丰富的信息媒体(文本、音频及视频)、以及不断产生的多语种数字内容使异构也呈现出丰富多彩、无穷无尽的形式。信息系统的异构是有层次的,因而互操作也是有层次的。互联网最初的设计,是为了解决机器的互联互通,因而只要在网络和硬件层面达到互操作就可以了。随着各类标准规范的建立,达成网络操作系统、分布式数据库等数据层面的互操作也逐步成为可能。然而人类的需求是无止境的,信息资源的增加和网络规模的扩张积累到一定程度的时候,仅仅数据层面的互操作往往不能尽如人意,直接表达和处理“语义”的需求就提了出来。

互操作是数字图书馆作为网络分布式应用需要解决的一个核心问题,而语义互操作是互操作的目的和重点。这并不是说目前的互操作解决方案中没有考虑语义互操作,而是没有把语义互操作当作独立的目标来考虑。可以设想,定义和设计独立的互操作层,使数字图书馆所包含的信息资源的语义“显性”化,而不是象现在大多数系统一样,隐式地、内含地包含在语法和其它结构中,将大大地促进数字图书馆的语义互操作问题的解决。

http://my.donews.com/keven/2006/06/13/thesisintro/
Nirvana Studio ?Web应用点击:22
 分类:web2.0; Semantic_Web 时间:2006-6-9 10:05:17 dvdlkdvd收录 复制到我的网摘
这个术语是由O'Reilly Media的Dale Dougherty 和 MediaLive 的 Craig Cline 在共同合作的头脑风暴会议上,提出来的。Dougherty提出了Web目前正处于复兴时期,有着不断改变的规则和不断演化的商业模式。

O'Reilly和Battelle总结了他们认为的表现了Web 2.0应用特色的一些关键原则:
将Web作为平台;
将数据变成“Intel Inside”;
分享和参与的架构 驱动的网络效应;
通过带动分散的、独立的开发者把各个系统和网站组合形成大汇集的改革;
通过内容和服务的联合使轻量的业务模型可行;
软件采购循环的终结(“永久的Beta版”)
软件凌驾于单一设备的层次之上;
拉动长尾的能力;


同语义网的比较
Web 2.0这个词的一个较早的出现是作为语义网的同义词。这两个概念有点相似而且是互补的。结合了基于标签的Floksonomy的社会性网络系统如FOAF和XFN,以及通过Blog和Wiki进行发表,已经创建了一个语义环境的天然基础
http://www.nirvanastudio.org/category/web-apps/
一堆信息抽取的资料文档 中文全文检索网_网页库级垂直搜索引擎全套技术点击:83
 分类:Semantic_Web; 资料; 垂直搜索引擎; 信息抽取 时间:2006-4-17 19:18:44 dvdlkdvd收录 (还有2人收录) 复制到我的网摘
很多文章
http://www.fullsearcher.com/n200511171744735.asp
Keven’s Blog 数图研究 ?语义互操作实现的两条路径点击:24
 分类:Semantic_Web; 互操作 时间:2006-4-1 20:35:53 dvdlkdvd收录 复制到我的网摘
数字图书馆的建设目标是向用户提供围绕信息资源的各种服务,实现语义互操作的主要困难是不同的数字图书馆采用不同的硬件环境、编程语言、网络环境、数据格式等,因此提供一个规范信息描述和信息解释的系统环境作为一个统一框架,必须以适当的方法管理和使用不同元数据和本体(不论是不是规范的或有意识)建立的语义系统,必须建立或对已有系统抽象出一个统一的、能够进行互操作的语义层。

http://my.donews.com/keven/2006/04/01/implementation/
Keven’s Blog 数图研究 ?笔记:关于“语义”点击:46
 分类:Semantic_Web 时间:2006-3-25 0:33:47 dvdlkdvd收录 (还有3人收录) 复制到我的网摘
语义与“知识”

语义是客观的,没有经过理解的,没有达到接受端的内容;而知识是经过受体理解的,包含主观成分的内容。他们是互相包含、可以相互转化的。因此可以把语义理解为知识的客观描述,由某种受约束的人工语言作为载体。

机器之间的理解一般指语义理解,这也是“语义web”建立的目的之一。当然机器是可以通过语义而传输知识的。

RDF/RDFS提供了标准和明确的方式描述资源的元数据属性,可应用于任何抽象层次。OWL在RDF资源描述之上提供了资源/属性关系的描述和推理能力,由于OWL应用了描述逻辑而使得其应用系统具有了复杂的规则系统,当然也可应用于信息系统的简单的一致性或完整性维护。

本体是一种形式化的描述知识和术语的方法。即通过概念、概念间的关系等描述一个知识体系,并由于其“形式化”,可应用于计算机操作。

本体的最大功用在于共享/重用语义。

http://my.donews.com/keven/2006/02/12/notes-on-semantics/
Keven’s Blog 数图研究 MTSR会议后续报道:三个特邀报告的讨论点击:30
 分类:Semantic_Web 时间:2005-12-6 14:20:17 dvdlkdvd收录 复制到我的网摘
我的理解是folksonomy与关键词抽取没有本质的不同,但是在产生程序和方式上可能有所不同,folksonomy应该多为 “赋词”,可以是文中没有(抽取不到)的词,甚至可以是一个号码(例如分类号等),而关键词抽取常常只能产生于文本对象中。因而folksonomy可以 用于图片、音视频等多媒体对象。Folksonomy不一定经过规范化,因而说folksonomy word=keyword=concept是不对的,但是他们也是可以互相转化的。转化之后是不是应该叫做taxonomy,甚至经过附注概念之间的关系 约束并经过形式化之后能够变成ontology,这恐怕需要业界制定标准才能解决目前这些概念的边界问题,从而彻底解决这些新生事物的概念之争。当然这个 想法是个乌托邦。

本体式可以被部分认同的,不一定是一个Ontology中的所有术语,可以只是一个子集(这一点多像我们的元数据应用纲要AP的设计理念 啊),可以映射到具体的应用系统中去。本体的好坏甚至可以用其术语的被接受程度来评价。第二:tag是个人数据,而tags所组成的folksonomy 则已成为一组人群所共用的数据了,TagOntology(头一次听到这个概念,实在是越来越混乱了)并非是为了在folksonomy的使用中对某些 tag达成共识而提出的,而是为了便于tag标注软件共享tag而使用。我的理解是并非是基于“概念”而规范的,而仅仅是为了使用的方便性而提供一些“联 想”“导航”功能,犹如全文检索的相关性排序一样,并不能做到非常合乎人的需要。

国内搞Semantic Web的人应该说不少,但是各自为政,交流很少,也难以使项目和技术成果有一顶的系统性和延续性,甚至在我看来国内有不少计算机的硕士博士对 Ontology及相关semantic web技术存在一定认识上的偏差,或者过于注重从计算机科学基础(如算法及逻辑)方面进行证明或求得突破与进展,对于应用技术领域,如体系架构、应用模 型、标准规范等方面比较轻视,也因此国内有关技术的应用实践方面基本上是一片空白,为国外培养了大批人才,将来还要花大钱应用国外的技术。
http://keven.wordpress.com/2005/12/05/mtsr浼氳鍚庣画鎶ラ亾锛氫笁涓壒閭鎶ュ憡鐨勮璁?
Google Home Base - 博客点击:29
 分类:web2.0; Semantic_Web; 搜索引擎; Google 时间:2005-10-28 13:55:53 dvdlkdvd收录 (还有32人收录) 复制到我的网摘
摘:
google并不是要建立一个Tim Berners-Lee等人理想中的SW,因为其实google其实只需要索引SW中的信息即可,因为如果SW建立起来,索引是一件简单的事情,甚至产品实现上面比google现在的搜索引擎更简单,技术要求更低。然而,问题就出来了,是先建立一个SW,然后来索引呢,还是先索引整个互联网,然后再生成把它放到有组织的SW里面去呢,这就是为什么google打造SW时遇到了先有鸡还是先有蛋的问题。
那么只说的猜测是,目前Google base的作法是,目前互联网上的信息是很难组织,那么让用户提交有组织的信息到google,就能形成局部的SW。而这个局部的SW,就可以实现聚会服务的描述、网站上关于时事的文章、二手车出售列表等等信息的精确定位,机器也就能够理解这个范围内的信息。

http://blog.donews.com/sayonly/archive/2005/10/28/605465.aspx
元数据映射:实用的权宜之计 - 数图研究点击:30
 分类:Semantic_Web; 元数据; 数字图书馆 时间:2005-9-21 15:06:35 dvdlkdvd收录 (还有1人收录) 复制到我的网摘
数字图书馆实践总是等不及计算机理论的发展,操起手边的家伙先干上再说。在语义互操作问题的解决框架还没有什么突破性进展的时候,元数据映射就已经土法上马了。当然下面介绍的OCLC的做法可能也是目前最“先进”的方法了。至少可以为将来基于本体的、由代理实现的、自动的Web服务积累一定的经验,甚至可以重用这些OCLC现在开发的代码(如METS封装好的不同格式元数据的映射转换代码)。








这是OCLC2002的项目:“元数据模式转换服务Metadata Schema Transfermation Service”,旨在探索为基于Web的数字图书馆提供元数据转换服务的方法。项目认为,数字图书馆元数据模式转换,有几个前提条件:

1、 需要有一系列元数据标准规范,数字图书馆应用必须基于这些标准规范。之所以称为标准规范,需要有一定的权威性、一致性、应用领域、维护方式/机制/责任者等等,并需要有一定的形式(即供人读的形式和供机器读的XML或RDF模式);

2、 基于上述1的各种标准规范,建立元数据元素数据字典库(即元数据术语库,可以归入4);

3、 不同元数据标准规范(格式)的映射规则能够建立起来。完全无关(或非常灵活/无形式化规范)的元数据方案是无法相互映射的;

4、 可通过元数据登记系统实现丰富多样的元数据标准规范、格式、语义、模式等查询和转换功能需求;

5、 提供分布式查询能力;

6、 建立基于标准的元数据索引库(具体应用)。








本人认为其核心实际上是建立注册登记系统,所有功能都可以在其中实现。将来也可以以此为核心实现基于本体的语义Web服务。

http://blog.donews.com/kevenlw/archive/2005/09/16/556531.aspx
用IRS-III实现语义万维网服务 - 数图研究点击:43
 分类:Semantic_Web; web_services 时间:2005-8-29 9:04:19 dvdlkdvd收录 复制到我的网摘
目前的Web服务还基本上是基于人工的。其核心是一个注册系统(UDDI),登记有各类服务的描述(应用WSDL),技术关注的重点在于输入输出的数据类型和存取细节,基本没有考虑到服务的自动发现、中介(mediation)及组合服务(composition)等功能性的实现方法。目前的应用一般是:人工查询到所需的服务之后,编写相应的接口程序进行应用组合。而IRS系统的目标是尽可能使这一过程自动化,其中就会牵扯到众多德语义描述和理解问题。这实际上是一项新技术推广应用中非常重要的一环:过程的标准化和工具软件的开发。IRS-III也是开放源码,感兴趣的可以下载安装,并在其基础上开发自己的语义万维网服务。



IRS项目的总体目标是建立因特网上自动或半自动的语义服务。IRS-I系统实现了基于UPML的知识库系统,IRS-II系统采用Web服务技术实现了这个知识库系统,IRS-III系统应用了WSMO本体来进一步支持语义服务。



软件代理能够自动解析WSDL描述的语义,并在UDDI中判断同类的Web服务所提供的功能,通过比较而选择适当的服务。近年来这方面的进展很大。基本方法是采用形式化的语言详尽地描述Web服务的各个方面和组成部分。下文涉及到很多缩写,先列于此备考:



IRS:Internet Reasoning Services

WSMF: Web Services Management Framework (HP)

WSMF: Web Service Modeling Framework (W3C)

WSMO: Web Service Modeling Ontology

UPML: Unified Problem-solving Method Description Language

WSML: Web Service Modeling Language

WSMX: Web Service Execution Environment
http://blog.donews.com/kevenlw/archive/2005/08/27/528977.aspx
学习“语义网格”--数图研究笔记点击:30
 分类:Semantic_Web; 网格 时间:2005-8-1 8:33:45 dvdlkdvd收录 复制到我的网摘
认为网格可以分为数据、信息和知识三层并将这种想法付诸R&D实施的大有人在

语义网格是目前最大的、以知识(信息的语义)为操纵/管理对象和目的的研究计划,最接近我们图书馆学研究的核心领域。前面我们探讨过,网格与Web服务已经全面合流,前者称为后者的一种形式,可以看成一组中间件构成的分布式计算平台,提供网络、硬件、软件资源共享的网格能力。而语义网格则是语义万维网与网格发展的一个杂交,提供的是资源内容(信息)共享的能力,即信息系统的语义互操作的能力,这超越了计算机仅仅作为工具的资源共享,而直取计算机作为其存在目的的共享——信息的语义。
http://meta.blogchina.com/2447032.html
数字资源组织的元数据方法(下)--数图研究笔记点击:28
 分类:Semantic_Web; 本体; 元数据; 资源组织 时间:2005-7-25 10:19:49 dvdlkdvd收录 复制到我的网摘
元数据方法不仅应用于信息系统建立过程中对数字资源的描述和处理方面,而且应用于数字资源组织体系的完整过程。

完整的数字资源组织体系(可以类比于传统的情报检索系统,所不同的地方在于传统的情报检索系统只是索引文摘等二次文献数据库,而这里多为全文数字资源)应该包括以下四个方面:

1. 对资源内容的处理,即数字资源进行结构化描述(元数据著录),按照不同的属性进行有序化组织、索引、链接、建库、存储等;这个过程是资源组织的最主要的过程,传统上这个过程就是信息资源的组织的全部。其中主要的内容组织方法和特征见下表所示。

2. 对用户使用习惯/知识背景(user profile)的处理,例如用户的定制和配置信息、使用偏好、相关反馈的统计信息等)。

3. 对提问的处理,包括语法转换,交互修正,提问分发,规范后控等。

4. 对检索结果的处理,包括剔重以及根据查询结果对于用户的重要性排序等。

注意!!!
"知识本体在某种程度上可以看成是关于元数据的元数据,或者说是关于元数据的方法论。"
"分类法与主题法也都可以看成是知识本体,因为他们都是从学科角度,对描述对象进行归纳或解构"
"知识本体弥补了元数据的不足,共同组成完整的元数据方法。本体以规范的方法建立起来,可以支持元数据方案之间的翻译、映射、参照、注册等等功能,进行本体之间的信息交换,使计算机能够无障碍地 "懂得"彼此的语言。"

知识本体对于元数据方法的贡献可以总结如下:
l 元数据方案不具有普遍适用性。无法克服特殊性与一般性的矛盾,而形式化的知识本体可以提供一种在元数据方案之间自动映射的机制,进而可以通过语义Web服务的体系架构进行实现;

2 元数据应用难以实现元数据方案本身的进化,而知识本体可以提供信息系统的其它视图,只需要通过自动或半自动的手段应用新的元数据方案;

3 元数据方案自身难以对不同知识体系、不同“粒度”的资源进行描述,而知识本体正是起到这个作用,从而实现异构资源和系统之间的语义联系;

4 单纯的元数据方案对于数字资源的整个生命周期的描述非常困难,而采用以诸如FRBR模型为基础的知识本体,这个问题便迎刃而解,不同生命周期的知识产权属性也非常易于描述;

除此之外,知识本体同时也在一定程度上解决了元数据方案的灵活性和可扩展性问题,以及在资源集合层面的整合的难题。

http://meta.blogchina.com/2368510.html
数字资源组织的元数据方法(上)--数图研究笔记点击:40
 分类:Semantic_Web; 本体; 元数据; 资源组织 时间:2005-7-25 9:11:29 dvdlkdvd收录 复制到我的网摘
本文简要分析了元数据方法作为数字资源描述和组织的一般性方法逐渐发展成熟的历史过程,认为元数据方法与传统图书馆的编目方法有许多相通之处,图书馆学的许多领域知识,如目录学、分类与主题方法、编目实践等为元数据方法提供了坚实的基础,结合近年来计算机领域语义万维网的研究开发进展,如知识本体的应用等,有望为数字资源的组织提供一整套方法论体系。文章最后分析了结合知识本体的元数据方法对于数字资源组织的作用和意义。
http://meta.blogchina.com/2368504.html
关于Ontology的问题--数图研究笔记点击:48
 分类:Semantic_Web; 本体 时间:2005-7-22 17:06:56 dvdlkdvd收录 复制到我的网摘
与叙词表相比,O的语义表示功能改进有多大?
即使在计算机领域,Ontology(本体)也有许多涵义,如软件工程与人工智能中的Ontology就很有些区别。现在公认的Gruber的定义(formal, explicit specification of a shared conceptualisation)也可以有多种实现途径,W3C的OWL可以看成是一种实现,Topic Maps也是一种实现。在我看来,本体就是对事物的某种认识,这种认识可以以各种方式表达出来(即explicit外在性,被认为是知识学习、共享、交换、利用的必需),最简单最直接的方式就是以概念体系来表达,然而现在一般认为仅仅是词表及其简单的关系构成的概念体系是不够的,领域知识虽然无法穷尽表达(任何领域知识都不是一个闭包),然而本体应该能够提供一种方式,使人们能够关联、推演、判断这些知识,于是本体希望能够表达人类知识的各个方面,例如函数关系、逻辑推理等等,而现在人们使用的本体表达工具(包括传统的给人用的分类法、叙词表,以及现在给计算机用的OWL等)都具有不同的应用范围和表达能力。
http://meta.blogchina.com/2342689.html
我blog故我在--不苟同“陈一舟:WEB 2.0的商业之道 ”中对Semantic Web和web2.0的比较点击:19
 分类:web2.0; Semantic_Web 时间:2005-7-22 16:46:00 dvdlkdvd收录 (还有1人收录) 复制到我的网摘
可以看到目前被web 2.0的拥趸者奉为“神圣”的一些东西: blog, rss, trackback tag, decentralize, social,REST, XML RPC, web service... (抱歉列了这么多,因为web 2.0似乎没有定义什么是web 2.0, 只定义了一切最时髦的东西就是web 2.0的) 其实就是semantic web中的一些部分或者基础概念,或者是一些前身的掠影, 这正说明了web的一个发展趋势。从一个面向页面的,面向人眼的web, 变成一个既适合人有适合机器的web, 一个所谓可以编程的web.
http://www2.uuzone.com/blog/mao/32158.htm
Web n.0--数图研究笔记点击:24
 分类:Semantic_Web; 本体 时间:2005-7-19 9:10:56 dvdlkdvd收录 (还有1人收录) 复制到我的网摘
从语义Web发展的角度,似乎web的版本可以这样解读
deep web->web1.0->web2.0(metadata ammotation web/the RSS web)->ontology web3.0->Rules Web4.0
http://meta.blogchina.com/2315336.html
变革性的Java Web模板技术 -- fastm点击:87
 分类:web_services; Java; Semantic_Web; 系统框架 时间:2005-7-15 23:23:03 dvdlkdvd收录 (还有2人收录) 复制到我的网摘
有趣 但如同评论中说的:
fastm的思路是把velocity中vm里的逻辑转移到了真正的JAVA代码中,这样一来,我认为只是转移了复杂性。虽然在vm里没有逻辑了,但是这样一来会导致JAVA代码里复杂数据结构的增加,也就是催生了VO(value object)的使用。

关注……
Java Web表现层技术的发展历史。

(1)首先,Servlet诞生了。Web程序员们很高兴,觉得用起来比CGI爽多了。

(2)过了一段时间,人们就觉得在Java程序里面写HTML太不爽了。毕竟,在HTML中,静态的文本标签占大部分,动态显示部分只是小部分。不如在HTML里面写Java代码。于是,JSP诞生了。成为了ASP的一个有力竞争对手。

(3)过了一段时间,人们又觉得HTML和Java代码混杂在一起,不仅页面结构很差,而且其中的Java代码也很难维护。这就是著名的“Java Code Pollution”问题。不如用自定义的XML元素替换Java代码,这样,整个页面就XML化了。于是,TagLib就出现了。

(4)可还是有一个问题,TagLib不能在一般的HTML浏览器或编辑器里面显示,页面不能所见即所得。而ASP.net挟Visual Studio快速可视开发之优势,正在Web开发领域攻城掠地。Java世界仓促应战,启动JSF项目。成员众多的Web Framework阵营中又多出一位权威的重量级选手。



各种新概念层出不穷,页面流程越来越复杂。

JSP + TagLib,Velocity,Tapestry,XSLT等都是含有逻辑的模板。如果没有特殊的插件,这些模板都无法正确在普通的HTML浏览器或编辑器正确显示。

而且,混杂在HTML中的逻辑是没有办法重用的;你无法把这些逻辑分离出来为通用的方法或类。

fastm模板是轻量级的DOM
和PHP模板一样,fastm模板只包含三种元素:

(1)静态文本。

(2)占位变量。用{}标志。

(3)动态块。用BEGIN-END DYNAMIC标志。
http://blog.csdn.net/buaawhl/archive/2004/07/14/41049.aspx
张晓林:只有元数据能救数字图书馆?--数图研究笔记点击:32
 分类:Semantic_Web; 元数据 时间:2005-7-14 21:00:03 dvdlkdvd收录 (还有1人收录) 复制到我的网摘
数字图书馆存在于分布、异构、动态的网络环境中,必须依据一定的原则进行建设才能确保其可获得、可互操作及可持续发展,这些原则就是“模块化”、“开放集成”、“开放服务”以及“可伸缩可扩展”。
完整全面的标准规范对于数字图书馆建设无疑具有非常重要的意义。然而应该说在目前我国数字图书馆建设所面临的“技术”、“法规”和“模式”三大难题当中,技术因素是比较容易解决和相对次要的。而且仅就技术问题而言,不同的模型所提供的视角不同,所归纳整理的问题也不同,特别对于发展迅速的IT应用来说,标准规范实在只是个相对的、应该退居后台的东西。
http://meta.blogchina.com/2271598.html
关于语义架构的一些思考题--数图研究笔记点击:45
 分类:web_services; Semantic_Web 时间:2005-7-13 9:38:16 dvdlkdvd收录 (还有1人收录) 复制到我的网摘
语义互操作是什么意思
本文说的仍是services,与我想象中的语义架构不同
一些问题正在思考中,先简单汇总在此。


语义互操作是什么?究竟要解决什么问题?语义功能要实现哪些服务?
技术实现环境问题:为什么要采用基于Web Services的架构解决数字图书馆语义互操作问题?而不采用基于CORBA或其它中间件技术?
建模问题:能够提出一个既灵活又相对稳定、能够得到公认的数字图书馆信息资源组织与查询模式/模型,并能为Web Services技术所支持吗?(参考5S模型、生命周期模型、电子商务模型、OAIS模型、情报检索模型等)
体系架构问题:采用Web Services(UDDI/WSDL)技术实现语义功能有什么问题吗?与Semantic Web Services有何异同?是否能实现服务发现、流程组配选优等功能?(Web Services实现ISO11179有可能吗?)
可行性/优化问题:是否有尽可能多的、足够简单的方法,或者设想出不需要人工进行很多参与的方法(例如自动提取、相关反馈、启发式算法等),实现语义功能?
什么是信息系统的语义架构?包含哪些内容?
本体在其中起什么作用?如何起作用?
元数据在其中起什么作用?如何起作用?
元数据与本体的关系是什么?
如何形式化地描述上述问题?论证上述问题?寻找上述问题的边界和特例?提出本论文的创新之处?
http://meta.blogchina.com/2241046.html
页码: [1 共1页、27项网摘

使用帮助 |  如何保存网摘 |  给365Key提建议 |  媒体报道 |  站长推广须知
Copyright (C) 2004 365Key.com--天天网摘 All Rights Reserved