近年来,随着各行业数字化、网络化建设进程的加快,更多的用户对视音频资料数字化存储、管理和再利用的呼声越来越高,尤其是如何增强各级部门之间数据调用和管理的便捷性已成为当下面临的最主流问题,大家都急需用先进的智能化媒资技术、产品和理念来改变原有落后的数据资源的管理应用方式,解决资料存储与相关业务管理以及互联互通问题。
各企业机构每年都会产生大量的各类视频、图片和文档等数字化资料,然而,在数字化、网络化技术高速发展的时代下,在资料的保存与再利用方面暴露出诸多问题:
- 资料数据都是各自存储管理,资源分散不集中,资源无法有效的进行共享查询,缺乏统一的存储及管理平台。
- 资料数据格式不统一,不规范,管理手段相对落后,归档、检索、调用资料时费时费力。
- 有部分资料是涉密的,要求不同子部门的资料不能随意的被其他科室翻阅,而传统的管理手段很难完全满足对保密资源的安全使用和监控要求。
在“互联网+”背景下,基于云计算、人工智能、大数据等新型网络技术,对各类数据资料进行整合,构建面向多对象、富负媒体的智能化资料管理系统。提高资料管理、共享和利用能力是此次项目建设的重要目标。
方案流程
各流程节点如下:
- 内容整理上传:
- 上传模式:
模式①——远程上传:对于公有云模式,通过专业传输软件上传各类文件。
模式②——私有云模式:本地拷贝上传。
- 资源对象:
纸质文档:利用扫描仪等将纸质文档、照片等资源转化为数字化信息。
电子文档:WORD、WPS、TXT、PDF等,以及各种格式的图片。
视音频资料: 网络媒体文件的数字化,支持MP3、MP4、RMVB、AVI、WMV、MPEG1/2、MOV、MXF等多种格式。
简单编目:将上传的资料进行名称、时间、分类等基本信息描述。
- 文件传输:支持各种类型文件传输到服务器。
大文件传输:支持大文件传输,特别适用于媒体视频等。
批量传输:批量添加文档,提高上传效率。
断点续传:当传输任务可能发生主动或被动中断时,重新恢复任务,可以保护之前已经传输成功的数据内容,并进行合理的接续,直至将所有数据传输完毕。
任务优先级调整:针对每个传输文件、用户及任务的优先级调整,动态地调整并发传输的带宽消耗,为高优先级的传输分配更多资源。
- 智能处理:
通过人工智能的利用,对文本、图片及声音进行特征提取,文字、图片、视音频等均可识别,包括字幕提取、人脸识别、语音识别、声纹识别、场景识别等,形成自动编目数据,方便内容的检索与利用。设立针对业务的敏感数据库,通过数据比对智能识别敏感数据。
- 编目归档:
二次编目:简单编目后,对经过大数据智能处理后的信息进行二次编目,包括人工校验和内容补充,保障信息准确度和丰富性。
编目审核:对编目的完整性和内容的正确性进行审查核对,出现问题交给责任人或由审核员进行修改。
- 发布:
固定发布:提供最新更新发布和全文检索发布。
智能发布:在大数据智能分析基础上对内容库进行数据整理和关联,可按不同分类进行专题查看、自动分析当前信息热点、自定义订阅信息来源和类型、基于推荐引擎向不同用户提供个性化推荐信息等;也可根据用户自定义的关键词进行智能化专题发布。
- 下载:
用户检索到响应内容,在权限允许的情况下进行下载使用。。
灵活的编目标准定义
采用图形化界面配置的方式,平台提供融合媒体内容元数据结构的自定义,用户可以方便的定义私有的元数据结构,增加删除修改元数据字段,而不需要去改动数据库表结构。满足业务变化以及未来发展的需求。
入库时元数据信息的自动获取:在入库时,系统会自动抽取媒体文件的各种信息,包括内容大小,创建时间,格式,码流大小等等。
自动和手动相结合的编目方法:除去系统自动获取的元数据信息外,提供编目字段的信息手工输入,使得在入库的同时就完成了初编目工作,简化了工作程序。
自定义元数据自动提取规则:系统支持的自动抽取元数据信息可以按照不同的模板和规则,比如对于视频内容抽取的是格式和码流信息,对于图片抽取的是尺寸大小和分辨率等信息,哪些元数据需要自动抽取,这些都是可以设定成模板,供用户在入库时选取。
真正的自定义元数据字段,不需要手工修改数据库:系统采用图像化配置方式,可以有用户设定元数据字段类型,大小。并根据设置结果修改底层数据库结构,而不需要额外的定制研发。
人工智能技术的应用
人工智能技术的应用,可自动对音视频进行结构化信息处理,深度挖掘音视频本身内容信息,高效、高准确率的识别能力解放大量的人工劳动力。
人工智能技术主要作用是为视频内容进行智能自动化信息的处理,并利用结构化信息对视频内容构建深度的索引信息。利用智能化自动化的处理技术手段,包括语音识别技术、字幕识别技术、人像识别技术等,解放了大量人工劳动力并且大大提升了视频信息提取效率和检索精度。
人工智能调度是应该是整个系统的任务处理引擎,通过总控调度能够对采视频内容实时进行语音识别、视频字幕识别、人像识别等具体处理功能。
文档识别技术:文本和图片扫描后形成PDF电子化文档,利用OCR技术识别文字内容,直接转换为可编辑文本,并且能够自动提取机构、人物、关键事件等关键词和内容标签。
语音识别技术:实现对视频、音频内容进行语音识别转文字,并作为内容的编目元数据进行保存,不需要人工听抄,大大提高内容编目效率。
字幕识别技术:实现视频节目标题的识别,获得视频内容各个片段的标题,识别结果直接作为内容编目元数据进行存储。
人脸识别技术:实现图片和视频中重要人物的自动识别,可将人物名称、视频位置时间点信息提取出来作为内容编目元数据进行存储。定义标识人脸库,可以通过图片训练的方式对每个人物多个角度进行训练,每个人物标识可以从不同角度定义多张图片。训练完成后进行视频语音识别的同时进行人脸识别操作。可以设置人脸识别的相关度阙值来调节识别的准确率。支持定制人脸特征库。
高效的大文件传输性能
在云计算和互联网发展的大趋势下,越来越多的文件需要通过互联网做异地传输,以及本地到云端的传输。尤其对于媒体对象,传输的视频文件普遍很大,据预测,未来互联网80%的流量将来自于视频。因此如何保障大文件的传输速度更快、更稳定,且能保障传输的安全性和文件完整性,成为了一个迫切需解决的问题。
CloudMAM智慧媒体资产管理系统,通过大数据和人工智能技术相结合,智能得收录组织内部的数据。通过算法大大节省人力得投入。将内部得媒体资产最大化利用。辅助领导层做决策。适用于监察机关/公安机关/法院等政府机关。
