发布成功
开发一款实时将音频转换为文字的程序,并进行文本无关模式的说话人辨认。该设备为基础设备,可外接音频输入或麦克风设备。
1、离线声纹识别模块,采用文本无关模式进行特定人的声纹学习,并将声
纹进行编号,在之后音频转文字采集时,如果声纹库中存在此声音的所有人,则将特定人的音频内容标记为特定人。
a、声纹学习要多少秒?
b、声纹识别要多少秒?
实施细节:
将声纹存储于SD卡内,并采用SQLite数据库建立声纹与特定人的关联关系。
2、将实时语音实时转为文字。
a、采用实时语音识别(也可采用阿里云等实时识别SDK)
b、将语音与存储的所有声纹对比后如果有匹配的声纹,则将语音与声纹建立关联。
如:{386}语音正文内容 386既为声纹id
实施细节:
将实时音频转文字后存储于SD卡内的SQLite数据库中。
1、我爱方案网是会员制服务,服务商通过竞标后即可联系雇主;
2、项目预算与报价不代表最终成交价格,成交价以双方协商为准;
3、平台提供设计项目对接服务,希望促成高效合作,对交易双方不收取佣金,谢谢留意!