语义网=有意义的网络。php
“若是说 HTML 和 WEB 将整个在线文档变成了一本巨大的书,那么 RDF, schema, 和 inference languages 将会使世界上全部的数据变成一个巨大的数据库。”ios
--- Tim Berners-Lee, Weaving the Web, 1999git
=========================web
对于Web 3.0的概念更是众说纷纭,如把Web 3.0等同于基于浏览器的虚拟网络操做系统Web OS,或等同于智能语义网,或等同于Web服务;有的提出Web 3.0是XML Web Services,属于开放式OPenAPI(应用程序编程接口);Google则把云计算看作是Web 3.0,(Google CEO Eric Schmidt在韩国首尔数码论坛(Seoul Digital Forum)上,定义Web 3.0的概念):“Web 3.0是指集合众多应用在一块儿,并带有如下特色:应用相对少,数据成云状分布,应用能够运行于任何设备上(电脑或者手机均可以),应用速度很快且能够高度个性化设置,呈病毒化几何数量级的分发(经过社会网络、电子邮件等)。数据库
1.Web 3.0的API(应用程序编程接口)是全球范围的,也就是XMLWebServices;编程
2.Web 3.0的速度达到10G,全部的应用都不用担忧速度;浏览器
3.Web 3.0是一个技术框架或操做系统。安全
为了说明Web 3.0,咱们须要回顾Web历史上的重要浪潮。它们不是严格按时间定义的,而是交叉重叠在一块儿的。服务器
1.Web l.0:任何人能够交易。1.O是关于来自一些主要的公司,如:eBay,Amazon和Google等。咱们一直认为它们仅仅是网站,但它们其实是一些功能丰富、容易上手、扩展性强的应用程序,这些特性之前不多被普通消费者看到过。Web 1.0在今天依旧具备很大的推进力,而且将持续很长时间。网络
2.Web 2.0:任何人能够参与。Web 2.0特色是用户产生内容、合做化、社区化。表明性的事物就是:Blog、Wiki等。任何人能够参与到内容的建立中。在You Tube上上传一个视频,在Flickr上上传参加聚会的照片。全部这些都不须要专门的技术,仅仅须要链接上互联网。参与改变了咱们对于内容的理解:内容不是固定在发布者那里,它是活动在任何地方的。
3.Web 3.0:任何人能够创新。Web 3.0经过改变传统软件行业的技术和经济基础来改变现有的一切。新的Web 3.0强调的是任何人,在任何地点均可以创新。代码编写、协做、调试、测试、部署、运行都在云计算上完成。对于企业来讲,Web 3.0意味着SaaS程序能够比传统的c—s软件更快、更高效的开发、部署、升级。对于开发者来讲,Web 3.0意味着他们须要建立一个理想的应用程序,所须要的仅仅是一个想法,一个浏览器。由于世界上的每个开发人员均可以访问强大的云计算,Web 3.0是全球经济的推进力。
从上述来看,咱们认为:Web 3.0跟Web 2.0同样,仍然不是技术的创新,而是思想的创新,是本体技术以及知识组织观念在网络空间中的延伸和深刻发展。Web 3.0的最大价值不是提供信息,而是提供基于不一样需求的过滤器,每一种过滤器都是基于一个具体需求。若是说Web 2.0解决了个性解放的问题,那么Web 3.0就是解决信息社会机制的问题,也就是最优化信息聚合的问题。因此,Web 3.0的核心内涵就是信息的高度整合和高度的智能化服务。
Web 3.0的布局能够划分为四个不一样层面:API服务、聚合服务、应用程序服务以及被服务的客户。
应用程序接口(API)服务。API服务是使Web 2.0运行的主服务器,而且将成为Web 3.0的引擎。下面是一些例子:谷歌的搜索和AdWords API;Areazon.com的附属API;大量的RSS源;众多的功能服务,好比包含在StrikeIron网络服务市场(strikeiron.com)(Wainewright 2005)里的那些。这个基础层最突出的特征之一就是它是商品层。随着Web 3.0逐渐成熟,将会产生一个近乎完美的市场,它将从最高容量的服务中挤出全部利润。
聚合服务。这些服务是一种中介,经过将原始API服务以一种有用的途径捆绑在一块儿,来解决一部分定位上的困难。各类各样的RSS聚合器和新兴的网络服务市场,如Strikelron服务都是很典型的例子。
应用程序服务。最多、最持久的利润应该出如今这一层。这些服务将不一样于现有的企业应用程序种类,如CRM或ERP,而是做为一种新型的复合应用程序,将多种服务的基础功能集中起来,帮助用户以一种灵活、直观的方式达到目的。一个有望增加的领域的例-g-.是语音商务(voice commerce(v-commerce)),它涵盖了语音识别的应用,该应用的目的在于使声控服务,包括互联网浏览和电子邮件提取成为可能。
被服务的客户。在Web 3.0界面的设计中,客户端逻辑发挥了重要的做用,可是用户更但愿掌握和控制Web 3.0的一些后台的操做知识。
从数十亿份造成网络的文件和将其整合在一块儿的连接中,计算机科学家和愈来愈多的新公司企图找到开发人类智力的新途径。它们的目的是在现存的网络系统之上增长一层含义,它将使现存网络不像一份目录而更像一个向导——甚至为人工智能系统提供了基础。为了完成这种程度的人工智能,即机器可以思考而不是仅仅遵从指挥,研究者已经投入了半个多世纪的精力,但仍未成功。Web 3.0的一个主要技术是语义网络。
做为Web 2.0的替代物,Web 3.0仍然是创建在Web 2.0的基础之上,而且实现了更加“智能化的人与人和人与机器的交流”功能的互联网模式。笔者从信息媒体网络化角度出发,概括总结了Web 3.0四个方面的主要特征。
1.微内容(widget)的自由整合与有效聚合
Web 3.0将应用Mash—up技术对用户生成的内容信息进行整合,使得内容信息的特征性更加明显,便于检索。将精确地阐明信息内容特征的标签进行整合,提升信息描述的精确度,从而便于互联网用户的搜索与整理。同时,对于UGC(用户原创内容)的筛选性过滤也将成为Web 3.0不一样于Web 2.0的主要特征之一。互联网用户的发布权限需通过长期的认证,对其发布的信息作不一样可信度的分离,可信度高的信息将会被推到互联网信息检索的首项,同时提供信息的互联网用户的可信度也会获得相应的提升。
最后聚合技术的应用将在Web 3.0模式下发挥更大的做用,TAG/RSS基础聚合设施,渐进式语义网的发展也将为Web 3.0构建完备的内容聚合与应用聚合平台。将传统意义的聚合技术和挖掘技术相结合,创造出更加个性化、搜索反应迅速、准确的“Web挖掘个性化搜索引擎”。
2.适合多种终端平台,实现信息服务的普适性
Web 3.0的网络模式将实现不一样终端的兼容,从PC互联网到WAP手机、PDA、机顶盒、专用终端,不仅应用在互联网这一单一终端上。
现有的Web 2.0只能经过PC终端应用在互联网这一单一的平台上。如今层出不穷的新的移动终端的开发与应用都须要新的技术层面和理念层面的支持。而Web 3.0将打破这一僵局,使得各类终端的用户群体均可以享受到在互联网上冲浪的便捷。
3.良好的人性化用户体验以及基础性的个性化配置
Web 3.0一样以人为本,将用户的偏好做为设计的主要考虑因素。Web 3.0在对于UGC筛选性过滤的基础上同时引入偏好信息处理与个性化引擎技术,对用户的行为特征进行分析,既寻找可信度高的UGC发布源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳的设计方案,帮助互联网用户快速、准确地搜索到本身想要的感兴趣的信息内容,避免了大量信息带来的搜索疲劳。
个性化搜索引擎以有效的用户偏好信息处理为基础,对用户进行的各类操做以及用户提出的各类要求为依据,来分析用户的偏好。经过偏好系统得出的结论再归类到一块儿,在某一内容主题(如体育方面)造成一种内容搜索的聚合、推送,达到更好地知足用户搜索、浏览的须要。将这一技术引入到图书馆信息服务中来,将会给传统图书馆服务带来巨大的影响。个性化引擎的创建是以读者偏好系统为基础,偏好系统的创建要全面并且与内容聚合相联系。有了对读者必定的偏好分析,才能创建起完善的个性化引擎。
4.有效和有序的数字新技术
Web 3.0将创建可信的SNS(社会网络服务系统),可管理的VoIP(Voice over Internet Protocol)与IM(即时通信、实时传讯),可控的Blog/Vlog/Wiki,实现数字通讯与信息处理、网络与计算、媒体内容与业务智能、传播与管理、艺术与人文的有序有效结合和融会贯通。
Web 2.0模式下的网络社交平台,只是简单地将人与人经过互联网这一平台链接起来。经过互联网注册在SNS的平台上结交朋友这一途径,并不能确保注册信息的可靠性和有效性,并非每一次交际圈的扩展都会带来相应的利益需求,这一过程进行下去的结果将会致使自己信息的外泄和零乱、不可靠信息的泛滥,这些都颠覆了人们想利用互联网来扩展人际交往的初衷。这一问题在Web 3.0模式下,将经过对用户的真实信息的核查与认证这一方式来解决。高可信度的信息发布源为之后交际圈的扩展提供了可靠的保障。与此同时,人们在交际的过程当中,也能够更迅速地找到本身须要的人才,而且能够彻底信任这些可信度高的用户提供的信息,利用这些进一步扩展对本身的有利的交际圈。
Web 3.0模式下可管理的VoIP与IM,一样为互联网用户的使用提供了方便快捷的服务方式。可信度越高、信用度越好的用户发布的信息将会被自动置顶,既提升了信息源发布者的可信度,同时使得这些有用、真实的信息更快地出如今用户的面前,发挥信息的最大效力,提升了信息的使用率,下降了信息查找的时间损耗。
Web 3.0模式下可控的Blog/Vlog/Wiki,一样也是为了提升消息的利用率与查找信息的便捷度而生的。这些本来在Web 2.0模式下容许用户随意发布的Blog/Vlog/Wiki会使得网络上堆积大量杂乱无章的信息,为用户的搜索带来极大的不便。由此,Web 3.0提出了“可控”这一律念,使得信息的发布与使用链接起来,若是想搜索高可信度的信息,能够点击可信度高的用户撰写的Blog/Vlog/Wiki,实现可信内容与用户访问的对接。提供了可靠的保障。与此同时,人们在交际的过程当中,也能够更迅速地找到本身须要的人才,而且能够彻底信任这些可信度高的用户提供的信息,利用这些进一步扩展对本身的有利的交际圈。
Web 3.0模式下可管理的VoIP与IM,一样为互联网用户的使用提供了方便快捷的服务方式。可信度越高、信用度越好的用户发布的信息将会被自动置顶,既提升了信息源发布者的可信度,同时使得这些有用、真实的信息更快地出如今用户的面前,发挥信息的最大效力,提升了信息的使用率,下降了信息查找的时间损耗。
Web 3.0模式下可控的Blog/Vlog/Wiki,一样也是为了提升消息的利用率与查找信息的便捷度而生的。这些本来在Web 2.0模式下容许用户随意发布的Blog/Vlog/Wiki会使得网络上堆积大量杂乱无章的信息,为用户的搜索带来极大的不便。由此,Web 3.0提出了“可控”这一律念,使得信息的发布与使用链接起来,若是想搜索高可信度的信息,能够点击可信度高的用户撰写的Blog/Vlog/Wiki,实现可信内容与用户访问的对接。
在Web 3.0中有可能增长语义网络。The Economist指出,语义网络浏览器将很快投入使用,在这个浏览器上,人们能够进行发布数据、画图等活动。“朋友的朋友”网络就是一个范例,在该网络中,网络社区中的个体以他们与朋友之间的连接的形式来提供本身的信息。语义网络有助于可视化如此复杂的网络并组织它们以加深对社区结构的理解。
语义网络(Semantic web)是网络的进化延伸。在语义网络中,网络内容不只能够用人类语言来表达,也能够以一种能够被智能计算机软件代理理解、翻译和使用,使得它们查找、分享和整合信息更加容易的形式来表达。这项技术起源于万维网联盟主席蒂姆·伯纳斯一李对互联网的见解,即互联网是数据、信息和知识交换的共用媒介。语义网络的核心包括一种哲学、一系列设计理念、相互协做的工做团体以及各类可用技术。
Borland将语义网络看做即将使用的Web 3.0的核心工具。Borland认为Web 3.0的新工具(其中一些工具已经在帮助开发人员将复杂应用程序结合起来)将改进和自动化数据库搜索,帮助人们选择度假胜地,更有效地对复杂的财务数据进行分类。
Web 3.0公用信息平台记录公用的信息类型,把Web 2.0时期对信息的引用和转载,变成对信息ID的引用和转载信息的记录,这样就实现了跨网站、平台流动,而且分布在各个地方的资源网站和我的中心平台信息是交互的,而我的信息平台上的信息是处于动态变化之中的(见图2)。
1.信息整合与交换
中心内的信息能够直接和其余网站的信息进行交互,能经过第三方信息平台同时对多家网站信息进行整合使用。经过内置的方法可以让小工具和远程服务或者站点进行数据交换,这意味着在同一个页面上能够同时享用多个站点的服务(包括邮件、股票信息、在线翻译、天气、游戏、资讯等)。
2.用户在中心上拥有本身的数据,并能在不一样的网站使用
迈向Web 3.0的第一步是“数据网络”这一律念的体现,结构化数据集以可重复利用、可远程查询的格式公布于网络上,好比XML、RDF和微格式。最近SPARQL的发展为网络上以RDF方式配发的数据库提供了一套标准化的查询语言和应用程序接口。数据网络让数据契合和应用程序互用性更上新台阶,使数据像网页同样容易访问和连接。在数据网络时代,重点主要是如何以RDF的方式提供结构化的数据。全语义网时期会拓宽语义范围,这样结构化,半结构化甚至零散的数据内容(好比传统的网页、文档等)都能以RDF和OWL语义格式的形式广泛存在。能够这样说,“个人其余电脑是一个数据中心”。
3.彻底基于Web,用浏览器便可实现复杂的系统程序才具备的功能
Web 3.0有两个特性:一是数据和应用能够所有存储在网络服务端,再也不须要在计算机上运行;二是在任何一台电脑或终端上打开浏览器,就能进入属于本身的世界。
“将来是数据跟着你走,你买了一台新的机器,不用担忧把数据拷过来或装新的应用软件,一个浏览器一切的环境、内容、信息所有在你面前了。固然这不止是在PC上,将来用手机、电视或其余的也能够接触这样的信息。将来你在任什么时候候、任何设备能够看到你全部的信息、作你全部的应用,都通过一个浏览器。”
=========================
semantic(语义的)这个词指有意思的或与之相关的。
语义网是一种使用能够被计算机理解的方式描述事物的网络。
象这样的句子能够被人类理解。可是如何可以被计算机理解呢?
陈述是由语法规则构建的。一门语言的语法定义了构建该语言的陈述所需的规则。
这就是语义网的本质所在 - 以计算机应用程序能够理解的方式描述事物。
语义网和网页之间的连接没有关系。
语义网描述的是事物之间的关系(比方说 A 是 B 的一部分,而 Y 是 Z 的成员)以及事物的属性(例如尺寸、重量、使用期限和价格等等)。
RDF(资源描述框架,Resource Description Framework)是一种用于描述网络上的信息和资源的的标记语言。
将信息至于 RDF 文件之中,这样的话,这些信息就有可能被计算机程序("web spiders")从网络中搜索、发现、摄取、筛选、分析和处理。
语义网使用 RDF 来描述网络资源。
若是您但愿学习更多关于 RDF 的知识,请阅读咱们的《RDF 教程》
假若有关音乐、汽车、入场券(或者任何别的东西)的信息被存储于 RDF 文件,智能网络应用程序就会将信息从不一样的源中进行摄取,并将其整合,而后以一个有意义的方式将信息提交给用户们。
相似以下内容的信息:
语义网不是快速发展的技术。
其学习曲线是缘由之一。RDF 是由那些拥有逻辑学和人工智能方面的学院背景的人们发展起来的。对于通常的开发人员的来讲,它并非特别容易被理解。
RSS 是一种用于构建语义网应用的快速发展的语言。若是您但愿了解更多 RSS 的知识,请阅读咱们的《RSS 教程》。
在下面的教程中,咱们将专一于 RDF 的使用,以发现语义网的潜力所在。
请单击下一章,您能够看到一个简单的语义网应用实例。
=======================================================
语义网。一个简单的应用实例。
假设某个语义网系统用于经过因特网管理二手车的销售和购买。
该系统可能包括两个主要的应用程序: 一个针对但愿购买汽车的人群 一个针对但愿出售汽车的人群
让咱们把这两个应用程序称为 IBA (I Buy Application) 和 ISA (I Sell Application)。
但愿购买汽车的人群使用的 IBA 应用程序相似这样:
在真实世界的应用程序中,您可能在第一次使用该程序时被要求标示本身的身份。您的 ID 将存储在一个 RDF 文件中。您的 ID 会把您标示为一个带有名字、地址、电子邮件以及 ID 号的人。
当您提交查询时,应用程序会返回一个待售汽车的列表,这个列表会按照年份、价格、位置和可用性进行排序。经过在 web 对 RDF 文件的搜索,此信息会不断地从 web spider 返回。
但愿出售汽车的人群使用的 ISA 应用程序相似这样:
当您提交表单时,应用程序会向您请求更多的信息,并把您的 ID 和信息存储在一个 RDF 文件中,以供 web 使用。
RDF 文件包含的信息相似:
在幕后,这个 "ISA" 应用程序会建立一个带有许多 RDF 指针的 RDF 文件。
它会建立一个指向带有关于 person 信息的文件的指针,一个指向带有关于 Volvo 和 Volvo 型号信息的文件的指针,一个指向带有关于 Volvo 经销商和出售者信息的文件的指针,等等。
RDF 指针是一种指向有关某事物的信息的指针(其实是 URL),相似知识数据库。
有关于此的优势在于您没必要对您本人或汽车的型号进行描述。这个 RDF 应用程序会为您对信息进行整理。
混乱?标准?咱们须要什么?咱们在期待什么?
由微软,由 Google,仍是由 W3C 发展标准?
RDF 是关于数据的数据 - 即元数据。RDF 文件常常会描述其它的 RDF 文件。未来有可能把全部的 RDF 文件链接起来构建一个语义网吗?
没有人知道,可是总有人去尝试。
咱们不认为语义网会依靠本身发展起来。它须要第三方的协助才能成为现实。
不太可能的是,您仅仅在因特网上发布 RDF 文件,就可以出售您的汽车。
必须经过不少力量的参与,才可以发展相似上面的 "ISA" 和 "IBA" 应用程序。一方为全部的项目构建搜索引擎数据库,另外一方则为其开发标准。
多是 eBay,或 Microsoft,或 Google,也多是别的公司。可是总会有人去作。
不久,咱们就会看到基于 RDF 的市场。而有一天,您将可以使用标准化的 RDF 文件在 Web 上收集有关几乎全部事物的信息。
它可能免费。也可能你不得不为信息,或至少为出售您的信息来付费。
在因特网上发布信息将比过去更加容易。也许 RSS 语言(参阅咱们的 RSS 教程)会成为不少问题的解决途径。
请阅读咱们的下一节 - 有关语义网这个话题的更多内容。
===================================================
这里列出了一些有关语义网的话题。
语义网不是可供搜索的免费文本。如但愿搜索或访问语义网,咱们须要软件的协助。
要使用语义网,咱们就须要 “语义网代理” 或 “语义网络服务”。这些“代理”或“服务”会帮助咱们在语义网上找到正在寻找的东西。
编者注:“语义网代理”:"Semantic Web Agents",“语义网络服务”:"Semantic Web Services"。
在语义网上,咱们可能会搜索这些信息:
在将来,要想在 Web 上找到任何信息,使用您的“语义网代理”就能够了。
我能信赖语义网上的一个卖家吗?我能信任语义网上的一个买家吗?
要解决上述问题,我须要访问更多 RDF 文件:
Source | Person ID | Person Name | Status |
---|---|---|---|
Citybank | 11223344 | John Smith | trustworthy |
VISA | 11223344 | John Smith | trustworthy |
Recorded | 11223344 | John Smith | unknown |
US Social Security | 11223344 | John Smith | born 10-10-1962 |
经过使用相似的这些 RDF 文件,个人“语义网”代理就可以肯定可以咱们是否能信任我正在打交道的这我的。
(可以经过 eBay 和 Amazon 之类的因特网交易公司来提供记录信息)
要运营语义网,就必须开发支付手段。
易用的因特网“储蓄存款”可能成为此问题的解决方案。
“储蓄存款账户”是一种只能接受存款的账户。它能够为因特网上的全部提供便利,只要获得您的 ID(或者您的电子邮件地址,很相似 PayPal),任何人均可以把钱存入您的账户。
经过使用这种支付手段,每一个人均可以在因特网上公布他们的银行账户,并在不须要中间人的状况下出售他们的汽车。
因特网银行业务的将来会是什么样子呢?
您能够在咱们的 RDF 教程中学习更多的内容。
=================================
The Semantic Web, Web 3.0, the Linked Data Web, the Web of Data…whatever you call it, the Semantic Web represents the next major evolution in connecting information. It enables data to be linked from a source to any other source and to be understood by computers so that they can perform increasingly sophisticated tasks on our behalf.
This lesson will introduce the Semantic Web, putting it in the context of both the evolution of the World Wide Web as we know it today as well as data management in general, particularly in large corporations.
After completing this lesson, you will know:
The World Wide Web was invented by Sir Tim Berners-Lee in 1989, a surprisingly short time ago. The key technology of the original web—from an end user's point of view, anyway—was the hyperlink. A user could click on a link and immediately (well, back then, almost immediately) go to the document identified in that link.
The following 6-minute video places that invention in the context of both what had come before—including libraries and low-level computer networks—and what came afterwards—including Web 2.0 phenomena such as Facebook and Twitter.
In summary, the great advantage of Web 1.0 was that it abstracted away the physical storage and networking layers involved in information exchange between two machines. This breakthrough enabled documents to appear to be directly connected to one another. Click a link and you're there—even if that link goes to a different document on a different machine on another network on another continent!
In the same way that Web 1.0 abstracted away the network and physical layers, the Semantic Web abstracts away the document and application layers involved in the exchange of information. The Semantic Web connects facts, so that rather than linking to a specific document or application, you can instead refer to a specific piece of information contained in that document or application. If that information is ever updated, you can automatically take advantage of the update.
This may appear at first to be a very subtle advantage, but it is one that will be illustrated in detail in the various lessons here at Semantic University.
The word semantic itself implies meaning or understanding. As such, the fundamental difference between Semantic Web technologies and other technologies related to data (such as relational databases or the World Wide Web itself) is that the Semantic Web is concerned with the meaning and not the structure of data.
Note: Other semantic technologies include Natural Language Processing (NLP) and Semantic Search. We will compare these technologies in separate lessons.
This fundamental difference engenders a completely different outlook on how storing, querying, and displaying information might be approached. Some applications, such as those that refer to a large amount of data from many different sources, benefit enormously from this feature. Others, such as the storage of high volumes of highly structured transactional data, do not.
Understanding when it is a good idea and when it is not a good idea to apply Semantic Web technologies is one of the primary objectives of the Semantic University. These topics will be addressed in much more detail in future lessons.
From a technical point of view, the Semantic Web consists primarily of three technical standards:
Though there are other standards sometimes referenced by Semantic Web literature, these are the foundational three.
One way to differentiate a Semantic Web application vs. any other application is the usage of those three technologies. However, the Semantic Web has been called many things, such as Web 3.0 or the Linked Data Web. Some of these names carry great significance, even with regard to the technology stack, so we'll cover this topic in a separate lesson.
Semantic Web technologies as a whole have made tremendous strides in the last decade. Some highlights include:
Truly, an entire industry has been born in the past ten years, complete with multiple trade shows on several continents, a growing user community, and active standards bodies.
That said, significant room for growth still can be found.