业务内容

数据采集

按照客户的具体需求,对各类规定文本、图片,语音、视频进行采集;
采集过程中可实现对其内容的筛选、文本化等相关任务,并可以进行各种复杂场景数据采集

  1. 1. 文本数据采集:广告、杂志、报纸、书籍等
  2. 2. 图片数据采集:实体图片、人物图片、场景图片等
  3. 3. 视频数据采集:视频会议数据、家庭录像数据等
  4. 4. 语音数据采集:方言、特殊情景语音、外语等

文本采集

公司拥有经验丰富的多语种语言专业团,能够为客户提供多种类的文本语料数据采集制作服务。文本语料数据采集的内容覆盖科研、生活、工作、娱乐等各个方面,形式包含新闻、博客、论坛、微博、对话设计、学术期刊、商业单证等,可以满足用户在语音合成、语音识别、自然语言处理、人工智能等技术建模研究的需要。

图像采集

面向人脸识别、表情识别、手势识别、体感识别和机器视觉等人机交互和模式识别技术研发需求,拓思可提供各类图形、图像数据的采集和标注服务。
我们目前能采集的数据种类包括:形体、人脸、表情、手写体、行为轨迹、地图位置、实体图像、图形符号、特定场景等数据。

1.手写体采集
能够采集制作多种语言、多种数据类型、多种手写风格、支持多种平台设备的手写体类数据。

2.人脸表情采集
在人脸和表情方面,积累了丰富的人脸表情数据采集和制作成功案例,用于人脸识别、表情识别和人机交互等技术的建模训练和测试。

3.地图信息采集
建筑、森林、交通设施、河川等地图数据的采集加工处理。

4.形体数据采集
在形体和手势方面,我们已完成多个成功案例,用于技术研究和测试。

5.其他数据采集
根据客户业务要求,拓思还提供实体图像、图形符号、特定场景以及其他数据的采集。

视频采集

对多种媒体类型、多种场景环境、多种设备平台进行视频数据采集,如MV、网络多媒体数据、视频会议数据、家庭录像数据等音视频数据,以满足图像处理和视频处理领域的不同需求,并根据客户的需求对这些数据进行转写和标注等处理服务。

语音数据采集

可采集多种语言(口音)的语音数据,覆盖亚洲、美洲、欧洲等多个国家和地区,并随着对客户需求的不断满足,我们能提供的语言种类和数据采集种类还在不断的增多。

语音识别数据采集包括:
车载语音数据采集;电话语音数据采集(手机/固话);自由对话语音数据采集;广播语音数据采集;情感语音数据采集等数据。

应用领域
语音合成、语音识别、说话人识别、语音评测、情感识别、音乐检索等

平台系统
能提供基于电脑、平板、手机等多种设备、支持Android\Window\iOS等多种OS系统

联系我们

  • 总公司 86-411-3989-5558
  • 東京分公司 050-5539-8972