大数据(Big Data)是包括结构化、半结构化和非结构化数据的数据集合,需要在海量数据中去研究或分析某一类事物的特质。近年来,我院众多教师和团队致力于大数据领域的研究,在理论和应用方面均取得显著成果,目前已经在公共交通、国民医疗、资源监测、社交网络、公共服务等方面得到应用。
一、公共交通
陈超副教授团队基于车联网的大数据应用与智慧城市研究,创新研究了基于出租车轨迹数据挖掘的城市动态特性理解。以出租车为泛在的传感网络,创新司机寻客、载客策略方法提高司机收入,利用分离树的在线异常轨迹检测方法防止乘客被宰客,并基于贝叶斯推理的多元数据融合乘车意图推测方法为司机和乘客提供及时精准的推荐服务,从而为司机、乘客及城市规划人员等提供丰富智能服务。
此外,其团队的“基于多源城市大数据融合的智能路径规划研究”,可向司机推荐风景最美行车路线规划方法、省油行车路线推荐方法等,满足日益复杂多样的用户出行需求,实现个性化推荐服务;“面向绿色出行的智慧城市新型交通模式研究”则面向建设绿色城市的需求,利用实时用户位置、车辆状态等信息(信息流),挖掘夜间出租车乘客出行的时空模式,设计夜班公交出行系统,探索新型城市交通模式(人流、物流),逐步逼近智慧城市美好愿景。
曾令秋副教授团队自2015年起,与重庆恒通客车有限公司合作开展“基于关键区域的良好驾驶技术挖掘和评价系统”研究,对公交车辆行驶过程数据进行挖掘与分析,获得优秀的驾驶行为参数。在获取关键区域的良好驾驶行为参数后,通过设计的移动APP实时采集公交车行车数据,并利用评估模型将实时数据和历史数据进行分析比对形成评价结果。驾驶员可按地图回放历史驾驶过程,发现自己驾驶行为的不足之处,从而改进驾驶行为、降低行车能耗,促进环境保护。
二、国民医疗
冯永教授、李学明教授、李季副教授、陈乙雄博士参与研发的重庆市重点产业创新专项“药械产销链大数据全程智能监管服务平台与应用示范”,为医疗行业主管部门、医药企业、医疗机构等用户提供服务。
该项目突破了大数据4项关键技术,研发了互联互通、两票制监管、数据可视化、综合监管4个核心系统,从而构建药械产销链大数据全程智能监管服务平台。行业主管部门可利用平台实现产销流向追溯与召回、资质证照管理、绩效评价、两票制监管等功能;经营企业可使用供应商、销售、绩效等管理功能;医疗机构可查看供应商、药事管理、药械追溯等功能。
三、资源监测
郑林江副教授、刘卫宁教授、冯永教授团队根据我国矿山从业人员数量众多、职业危害监管难度大的问题现状,参与研发了“矿山职业危害预警信息数据库与监测监管第三方支撑平台”。利用互联网和大数据技术,建立矿山职业危害预警信息数据库,构建了基于云计算和大数据的职业危害监测预警第三方支撑平台,该研究成果现已在典型矿区进行示范应用。
职业危害监测预警第三方服务平台逻辑结构
古平老师团队在“河南油田知识管理系统关键技术设计”项目中,综合利用知识图谱技术、自然语言处理技术、搜索引擎技术等,实现了对油田勘探、生产、存储领域知识的挖掘和自动分析,解决了知识库构建、分享和应用中的若干关键问题,如知识的多源采集、非结构和半结构知识抽取、知识地图构建、细粒度知识加工与提炼等。
四、社交网络
周尚波教授团队在社交网络大数据研究方面,参与了“重庆移动”官方微博监测研究,利用爬虫与数据挖掘等技术,对微博回复负面情感信息进行提取,进而分析微博的影响力等。
微博分析 微博转发深度关系图
冯永教授、尚家兴博士的“大数据驱动的社交网络影响力最大化问题研究”,从海量的大数据入手,提出了大数据驱动的影响力最大化问题模型,以解决在给定的社交网络中找到影响力最大的用户群体的问题。该项目相关研究成果已在新浪微博、LiveJournal、Orkut等大规模数据集上进行了应用验证。
大数据驱动的影响力最大化问题研究框架
五、公共服务
古平副教授团队“基于数据挖掘的住房公积金收益预测模型研究”项目,利用神经网络和时间序列分析模型,对重庆市住房公积金中心的沉淀资金进行了预测、分析,进而对公积金中心贴息贷款规模、投资方案等进行了多目标优化辅助决策,在保证中心流动资金安全性的同时,提高了资金运作的收益率。
钟将教授、冯永教授、李学明教授、尚家兴博士和刘大江博士参与研发的国家重点研发计划“专业内容知识服务众智平台与应用示范”,面向知识服务应用,建立开放式专业内容知识服务平台,提供众智化在线知识问答、个性化知识求解、知识竞价交易等知识服务与运营能力;创新知识服务新模式,探索跨领域融合,线上线下相结合的知识服务新形态,特别是知识服务业与互联网教育、制造业、出版业等跨界融合的模式,并将开展相关的实证应用示范。
汪成亮教授团队在智能环境服务社会研究方面,承担了国家自然科学基金面上项目,通过对于多尺度、多粒度、多模态的时空大数据智能挖掘分析,学习出智能环境中人的活动规律和模式。
五、基础技术研究
郑林江副教授、钟将教授、冯永教授、李学明教授、李季副教授参与研发的国家863计划“基于内存计算的实时大数据关键技术和系统”,其子课题“数据分片与组织技术研发与应用”围绕图数据和交通大数据,建立数据划分策略和组织管理技术,以提高其组织与查询效率。
冯永教授、周尚波教授针对用户检索意图模糊或输入图像语义信息不明确的场景,参与研发了国家自然科学基金“语义深度理解驱动的图像及文本统一检索研究”,将机器学习和似物检测技术相结合,提出了异构数据空间映射与归一化算法,构建了特征向量统一模型,最终实现高效、准确、富含语义的图文统一检索。
存储技术是物联网大数据时代中云(云计算大数据平台)、管(物联网)、端(嵌入式智能终端)的重要基础,然而目前的存储系统在高效性、可靠性、可扩展性、低能耗等方面表现出严重不足。我院研究员刘铎老师及其团队根据此情况,参与了“面向大数据的新型存储体系结构研究”,结合新型非易失性存储器的技术优势,开展面向内存计算、物联网与大数据应用等方面的研究,设计基于新型非易失性存储器的访存行为控制与管理策略,从而有效提升内存计算及大数据存储效能。