AI感知引擎


語音(yīn)識别

技術(shù)領先識别準确

采用(yòng)領先國際的(de)流式端到(dào)端語音(yīn)語言一體化建模方法,融合百度自然語言處理(lǐ)技術(shù),近場(chǎng)中文(wén)普通話(huà)識别準确率達98

多語種和(hé)多方言識别

支持普通話(huà)和(hé)略帶口音(yīn)的(de)中文(wén)識别;支持粵語、四川話(huà)方言識别;支持英文(wén)識别

語音(yīn)合成

提供多場(chǎng)景音(yīn)庫

提供風格多樣的(de)19種音(yīn)庫供您選擇,适用(yòng)于有(yǒu)聲閱讀(dú)、新聞播報、訂單播報、智能(néng)硬件(jiàn)等應用(yòng)場(chǎng)景,即将推出更多特色音(yīn)庫

語速、音(yīn)調可(kě)調節

支持多種參數配置,可(kě)根據場(chǎng)景需求對音(yīn)庫的(de)語速、音(yīn)調、音(yīn)量進行(xíng)靈活設置,滿足個(gè)性化需求

聲紋識别

聲紋(Voiceprint Recognition)簡稱VPR,作爲一種行(xíng)爲特征,具有(yǒu)唯一性和(hé)獨特性;

聲紋具備不易篡改的(de)特點,其次由于聲音(yīn)一般不涉及用(yòng)戶隐私問題,往往用(yòng)戶接受程度較高(gāo)。

人(rén)臉識别

人(rén)臉檢測與屬性分(fēn)析

精準定位人(rén)臉72個(gè)關鍵點,快速識别多種人(rén)臉屬性信息,包括年齡、性别、情緒、是否佩戴眼鏡等;能(néng)夠對人(rén)臉圖片進行(xíng)質量控制(zhì),确保圖片符合質量标準,保障後續人(rén)臉比對、人(rén)臉搜索的(de)準确性。

人(rén)臉對比

支持5種圖片類型的(de)人(rén)臉比對,包括生活照(zhào)、證件(jiàn)照(zhào)、身份證芯片照(zhào)、帶網紋照(zhào)、紅外黑(hēi)白照(zhào)。能(néng)夠比對圖片中兩張人(rén)臉的(de)相(xiàng)似度,并返回相(xiàng)似度分(fēn)值。

活體檢測

提供豐富的(de)活體檢測服務,包括圖片活體檢測、視頻動作活體檢測、唇語活體檢測及炫瞳活體功能(néng)。活體檢測也(yě)包含合成圖能(néng)力,甄别是否爲後期人(rén)工(gōng)合成的(de)視頻換臉、PS、人(rén)臉融合等篡改造假人(rén)臉數據,有(yǒu)效抵禦作弊行(xíng)爲,保障業(yè)務安全性。

數字人(rén)

數字人(rén)定制(zhì)

提供低成本快速定制(zhì)2D卡通、真人(rén)形象及3D卡通、超寫實數字人(rén)像。結合AI和(hé)計(jì)算機圖形學,具有(yǒu)超寫實、高(gāo)精度的(de)特點,音(yīn)唇精準同步、表情豐富逼真;同時可(kě)利用(yòng)先進的(de)TTS技術(shù)定制(zhì)專屬聲音(yīn);深度定制(zhì)包括捏臉、換裝、美(měi)容等打造專屬數字形象資産。

視頻合成

支持通用(yòng)類單視頻剪輯,添加動作、表情、圖表等素材,對單視頻快速剪輯發布,智能(néng)推薦分(fēn)發路(lù)徑,提高(gāo)視頻曝光(guāng)率 ; 可(kě)進行(xíng)批量視頻生産,實現從播報文(wén)本/音(yīn)頻到(dào)虛拟主播播報視頻的(de)一鍵式生成。

上(shàng)一頁

下一頁

上(shàng)一頁

下一頁