物联网的发展使信息的收集变得更加全面和迅速,于是就需要更有效的手段对信息进行储存和组织,并提供便捷的查询。这就用到了已经有着半个世纪历史的数据库技术。在上世纪60年代,诞生了以IBM的SABRE为代表的一些成功的早起数据库系统。这些系统在今天看来虽说很落后,但是在当时的时代背景下仍然是十分先进且有实际作用的。由于这些数据库如果要访问想要的内容,需要遍历整个数据库,这就是在其数据库最大的缺陷。而这类早期数据库被统称为“导航式数据库”。
数据库与物联网
无线传感网是物联网的一个重要组成部分,它的一个重要特点是以数据为中心。无线传感网的数据具有以下的特点:
1、海量性
假设有一个拥有100个传感器的传感网,而每个传感节点每分钟只传回1Kb的数据,那么每天的数据量就达到1.4Gb。如果是一些大型的敏感的传感网,每天的数据量可达1TB以上。至于未来物物互联的物联网时代,产生的数据就是十分庞大的数量。因此物联网数据具有海量性。
2、多态性
物联网的应用包罗万象,产生的数据自然也是多种多样。有温度、湿度等环境数据;有视频、音频等多媒体数据;还有与用户交换信息的结构化数据等等。数据的多态性必然增加数据的复杂性,不同网络产生的数据格式可能不同,就算是相同类型的数据也会有单位和精度的差别,一个测量量在不同的时间也在变化。因此物联网数据具有多态性。
3、关联性及语义性
物联网中的数据都不会是相互独立的。描述同一个实体的数据在时间上具有关联性;描述不同实体的数据在空间上会有关联性;描述实体的不同维度之间也具有关联性。而不同的关联性组合会产生丰富的语义,可以通过数据在时间或空间或维度上的关联性推断出实体的变化。
物联网搜索引擎
在物联网时代,大量的设备互联互通,海量的信息生成传输,这些都为传统的Web搜索引擎提出了挑战。首先网络接入设备的多样化造成了信息生成方式的多样化。如何高效的组织和管理信息是物联网搜索引擎的重中之重。另一方面,用户的查询模式也发生了转变,对搜索引擎的智能有了更高的期待。
从用户的角度来看,人们不再满足于坐在办公室里通过计算机使用搜索引擎。无论在哪里都能随时随地进行查询。搜索引擎应该利物联网优势,集合多模态信息进行查询。例如用户查询一个地理信息是,搜索引擎不但要查询结果和关键词的匹配程度,还应该能给出与关键词相关的一些周边信息。利用物联网技术可以使搜索引擎的查询结果更精确,更智能,更定制化,满足不同用户的需求,提供更好的用户体验。
索引技术
Web爬虫取回的页面信息,需要放入索引数据库里。索引建立的好坏对于搜索引擎有很大的影响,优秀的索引能够显著的提高搜索引擎系统运行的效率及检索结果的品质。文本分析技术是建立数据索引信息的支撑技术,它包含:关键索引项提出、自动摘要生成、自动分类器、文本聚类等,文本分析的对象包括词汇、HTTP文本标记和URL等。