お問合せ

サイトマップ

 

 

英語サイト

Home

技術

製品

企画・開発

会社概要

代理店

募集

 

技 術

音声音響技術 |音声認識技術 オーディオ技術 |  Bluetooth向け技術 |
不特定話者認識
特定話者認識音声認証 | 音声合成テキスト音声合成

 


 

 

音声・音響技術

 センサリ社のIC製品は、先進のHMM(Hidden Markov Modelling)やニューラルネットワーク音声認識、音声合成、録音再生などの音声技術とICテクノロジを使った製品で、最先端の機能を非常に低価格で提供します。 センサリ社は独自のHMMとニューラルネットワーク技術を開発しこの技術を採用することで高価なDSPや容量の大きなRAMを一切使わずに、信頼性の高い音声認識を提供しています。 特に独自のニューラルネットワーク技術は特定の話者による単語やフレーズを識別することのみならずセキュリテイを 向上させるために使用することもできます。センサリ社の 20年以上に渡るスピーチとオーディオテクノロジの経験を使用することでセンサリ社のIC製品は高品質なオーディオ出力を実現でき音質を劣化させること無く音声や効果音を 再現することができます。
またセンサリ社のソフトウェア製品は組み込み実装を目的とした小型ソフトウェアエンジンとなっています。長年IC製品で培ってきたHMM&ニューラルネットワークの音声認識技術を応用し実現しています。

それぞれの技術に対応する製品は下記の記号で示します。

ソフトウェア


          
 TrulyHandsfree   TrulySecure     TrulyNatural       BlueGenie

 

 

製品技術説明

音声技術説明

 

音声認識技術        Speech Recognition

 自然発音インターフェース     Natural Language Interface 

 

フレキシブル・グラマー
センサリ社NLP-5xの自然発音インターフェースはユーザーの命令発音に準じて認識することのできる技術です。認識する順番に捉われない方法で認識し単語が足りない場合には音声合成技術を利用して足りない単語を確認するなどができます。この画期的なフレキシブル・グラマー技術は複数の単語を一フレーズとしては認識することができ、且つ命令語を順番に発音する必要もないためもっとも自然な認識を可能としました。

 フレーズスポッティング      Phrase Spotting 

 
 

完全なハンズフリー操作
最大30語の命令のキーワード・スポッティングやフレーズスポッティングが騒音下でも可能です。会話中のトリガーワードを認識し音声認識操作に移行することができ完全なハンズフリー操作が実現できます。

 不特定話者音声認識      Speaker Independent   

  
 

言葉の登録は必要無し
不特定話者音声認識’Speaker Independent'とは誰の音声でも認識するという音声認識技術です。予め決まった言葉の辞書を事前に保存しこの言葉のみを認識させるというものです。この音声認識技術は汎用品に利用されます。 センサリ社の不特定話者音声認識は独自のHMMHidden Markov Modelling)&ニューラルネットワーク技術を使っています。 この技術はRSC4xシリーズとFluentSpeech製品で利用されており、高速・高性能な認識を実現しています。 不特定話者音声認識ではコンティニュアスリスニング、ワードスポッティングをサポートしています。

 特定話者音声認識       Speaker Dependent

  
   

辞書構成、言語、発音に影響されません
特定話者音声認識'Speaker Dependent'とは使用者が音声を登録して始めて使用できるようになる音声認識技術です。予め決まった言葉の辞書は保存されていないのでユーザーが任意に言葉を登録することができます。この音声認識は個人または数人で利用するなどの商品に利用されるます。 この技術は音声のみならず登録できる「音」であれば認識できるもの応用として効果音や動物の鳴き声など登録し認識させることができますセンサリ社の音声認識には主に独自のニューラルネットワーク技術を使っています。 RSC4xシリーズでは従来のニューラルネットワーク技術に加えHMM Hidden Markoff Modeling)技術を利用し、より高速高認識率を実現しています。 特定話者音声認識ではコンティニュアスリスニング、ワードスポッティングをサポートしています。
RSC4xシリーズは’不特定+特定話者音声認識’をサポートしています。不特定話者の登録単語と特定話者の登録単語を同時に認識することができます。

 音声認証(パスワード認証)  Speaker Verification

  
 

音声のバイオセキュリティー
音声認証(パスワード認証)'Speaker Verfication'は音声を登録音声と比較し認証する技術です。話者認証として利用できます。センサリ社の音声認証は’パスワード認証’というもので特定のパスワードを認証するものです。特定話者音声認識と近い技術ですが特定話者音声認識は一音声入力単語を複数の単語と比較し、結果として一致したもの戻すというものですがパスワード認証は一対一で比較しどの程度一致しているかを確認し結果を戻すというものです。

 

オーディオ技術          Audio

 テキスト音声合成         Test-to-Speech

 
 

テキストから音声合成を再生するソフトウェアエンジンです。
本技術はメールなどの文字を読み上げるなどに利用するための技術です。現在はPCおよびPDAプラットフォームに実装できるソフトウェアのみでセンサリ社プロセッサおよび他社プロセッサ実装には対応していません。 
また本テキスト音声合成(TTS)技術はボイス・モーフィーングに対応しており再生する音声を音程などを変化させ、男性、女性、キャラクターなどで再生することができます。
NLP-5xはUS英語のみ対応(スペイン語、フランス語、ドイツ語、中国語、日本語は開発中)。
FluentSoftUS英語、スペイン語、フランス語対応(中国語、日本語は開発予定)。
BlueGenieUS英語対応(ドイツ語、中国語は開発中)

 

 

 音声合成              Speech Synthesis

  
 
 

音声プロンプトに最適
音声合成’Speech Synthesis'は圧縮音声を再生する技術です。
センサリ社では複数の圧縮方式を採用しています。これら技術は従来のPCMADPCMMELPCELPなどとセンサリ社独自方式の'SX'音声合成などがあります。圧縮音声の再生レートは 1.0Kbpsの低圧縮から68Kbpsの高音質のまでの音声合成を提供しています。音声合成データへの変換は専用ソフトを利用すれば簡単に行えます。これら音声合成の原音はWAVファイルを利用しています。

 

 

 

ブルートゥース向け音声認識技術    Voice Recognition for Bluetooth Products

 BlueGenie音声インターフェース        Blue Genie Voice Interface

   

Bluetooth製品(ヘッドセット、音楽プレイヤー、ハンズフリー向け音声認識とテキスト音声合成
BlueGenie(ブルージニー)音声インターフェースソフトウェアはCSRBC-5MMKalimbaDSPで動作するソフトウェアです。Bluetooth製品メーカーには不特定話者音声認識、音声合成、テキスト音声合成を利用することでマニュアル無し、完全に音声だけで操作できるBluetooth製品を作ることのできるソフトウェアです。テキスト音声合成は着信時の発信者番号の読み上げやSMSの読み上げなどに利用可能です。
YouTube
動画:
BlueGenie CarKit
BlueGenie Headset



 

 

 

Home || 技術 | 製品 | 企画・開発会社概要 | 代理店 | 募集 | お問合せ | FAQ | サイトマップ

Contents Copyright Sensory Japan 2002-2020 All Rights Reserved.

PDFファイルを閲覧するためには、 Adobe Acrobat Readerを予めインストールしておく必要があります。