XBRL层次结构与财务信息数据挖掘(2)
2017-10-16 01:33
导读:标签来获得各上市公司投资收益。而对PDF与HTML文档,计算机只能将整篇的文档汇总到一起供我们集中阅读。 XML的思想精华在于分层,实现“信息显示与信
标签来获得各上市公司投资收益。而对PDF与HTML文档,计算机只能将整篇的文档汇总到一起供我们集中阅读。
XML的思想精华在于分层,实现“信息显示与信息内容相分离”、“信息内容与信息语法格式相分离”、“语法格式与语义规则相分离”、“语义规则与本体论相分离”。分层机制将语***释转化为了对树形结构文档的解读题目,这使得计算性能够使用一个相似的递回算法来实现,大大降低了工程实践的难度,也从实践的角度佐证了语***释亦是递回计算。不过不能因此而以为树形结构的XML文件就完整地表示了信息语义关系,XML不过是信息的语法形式,尽管语***释的元语言语句也可以是XML(事实上Schema、RDF、OWL都采用树形文档结构),但逻辑上两者处于不同层次上。
狭义地讲,计算机对XML的理解是根据Schema文档定义的语法要素(element)及要素之间的组合关系(complexType)识别出XML实例文档中语法要素,并据此建立语法要素与信息内容之间的关联。但假如没有RDF、OWL、Logic层次的支持,计算机理解只可能是限定于特定语言层次上的形式化理解。从广义上看,XML是一个包含了RDF、OWL、Logic的完整体系结构,计算机理解实质上是借助于递回算法,对各层次的关系完整把握。
二、XBRL的层次结构
作为XML的一个应用模式,XBRL的层次结构也有其特点。可以将现有的XBRL分为三层:技术规格(specification)、分类标准(Taxonomy)和实例文档(Instance Documents)。
技术规格,或称说明、规范,主要用于定义XBRL的各种专门术语,描述了XBRL文件的结构,具体规定了XBRL分类的标准和XBRL实例文档的语法和语义。固然有XML元素和属性的语义上的表述,但XBRL规格是一项侧重技术的文件,目的在于定义一项符合规范的XBRL文档。 (科教范文网http://fw.nseac.com)
分类标准是财务报告发布的语法格式,也部分定义了各会计报表要素的“语义关系”。如“资产=负债 所有者权益”、“主营业务收进是利润表的要素”、“Assets表达资产的概念”等等。分类标准由名为Taxonomy.xsd的XML Schema文档与相关联的五个XML链接库文件(Definition.xml,Calculation.xml, Presentation.xml,Label.xml,Reference.xml)组成,Taxonomy定义的是报表的语法形式,链接库文件定义的是报表语法要素的语义关系,其结构如图2所示。
XML链接库文件是使用链接语言(XLink)定义的,并不局限于外在形式上标签之间的链接(HTML链接则是外在形式上的链接),而是主要用来描述信息内容标签(元数据)之间的联系。XBRL的五个链接库文件定义的是XBRL Schema文档中各标签之间的联系,属于XBRL Schema的元语言范畴。显然,XBRL并未遵循语义Web的体系结构,其语义表达功能较为简单。