速錄技術與語音識別系統的區別
電腦速記技術是傳統手寫速記和計算機相結合的產物,它可以使語音信息即時轉化為電子文本,可以做到“會議畢,文稿出”。語音識別技術是讓機器通過識別和理解語音信號而轉化為相應文本或命令的高技術。由于語音信息具有連續性、多變性、動態性、瞬時性的特點,造成了語音識別的難度遠遠不像人們想像的那樣簡單--對著電腦的麥克風一說,字馬上就會出來了。它的識別難度它在于和不同的說話人、不同的說話速度、不同的說話內容以及不同的環境條件有關。
作為中文信息處理的工具,語音識別技術和電腦速記技術都是把稍縱即逝的語音信息轉化成文字,但二者的關系除了速記與錄音機的不同點相似外,還有以下幾點:
1、同音字、詞處理的問題
現代漢語中的大量同音字、詞一直是中文信息處理電腦化的瓶頸。電腦速記、語音識別在記錄語音信息時都會遇到這個難題,關鍵是記錄的準確率。如``以同等 xueli考研``是這個``學歷``還是這個``學力``;``秘書人員要正確領會領導shouyi``是這個``授意``還是這個``受意``等,即使是語音識別能夠完全記錄下語音信息,而且能夠達到百分之百的準確率,其功能仍然和錄音機一樣(二者的關系見上文),同樣需要人們的后期加工整理,這樣花費的時間要比人在當時記錄的時候要多得多。因為人在講話時,往往是口語,從口語到書面語的轉化,并不單純是落成了文字。
2、人們在理解語言時,可以根據語音之間的停頓、語調、語氣等,把聲音信息變成轉化文字,并實時添加相應的標點符號。語音識別在理解語言時,需要說出標點符號的具體名稱,因為機器在理解語言時,需要*斷句來理解的:``王處長冒號您從哪兒來問號另起一自然段空兩格今天的政治學習內容是前書名號鄧小平理論后書名號``,事實上人說話時是不說出標點符號的具體名稱的,這樣會很別扭。
語音識別在理解語言時會遇到字符正確串切分和對句子結構的理解問題。如``美國會考慮戰略導彈防御系統``是``美國/會/考慮/戰略導彈防御系統``還是``美/國會/考慮/戰略導彈防御系統``呢?``他yihuier/jiulai``本來是``他一會兒就來``往往會理解成``他一揮而就來``;``要及時把握……``語音識別就很可能會切分成``藥劑師把握……``。電腦速記是由人腦對語言信息進行切分,加入標點符號、分段的。
3、語音識別軟件對語料內容要求嚴格,需要人們說標準的漢語普通話,如果有方言、口音、土語等識別起來相當難,而且要事先進行發言人口音適應。盡管如此,文秘速記人員如果能夠聽得懂,一般都能夠記錄下來,也要求文秘速記人員必須具有廣闊的知識面,聽得多了,記錄的信息也就準確得多了,這也是文秘速記人員往往會比一般人辨別、采集語音信息能力強的原因。如果方言特別重的人講話,人都聽不懂,機器也就更難聽懂了。
4、語音識別只能識別單一的漢語語音信息,對于其他有聲信息都會被其認為是噪音而影響其識別的準確率。例如,在正在播放有背景音樂的朗誦詞里提取男女對話的漢語信息,轉化成文字,麥克風根本無法識別。
語音識別無法理解和識別交互式有聲信息,比如座談、討論、會談等多人發言時,麥克風無法辨識是哪位發言的信息,也不能只記錄這位發言人的信息,而把別的發言人的聲音信息阻隔在外。電腦速記技術由于是由人來把握,不但可以記錄下每個人的發言內容,還可以記錄下當時的場景,這樣的信息就會很豐富、生動。
5、新生事物的出現而產生的新詞語以及人名、地名等專業詞語,人們可以根據對語音信息的理解,選定具體是哪個字或詞。速記技術在記錄語言時,可以對同音字(詞)進行實時處理,以保證一次性在準確率95%以上,這也是為什么電腦速記的出現,能夠得到社會認可的原因,也是速記技術高效率的具體體現。由于漢語詞匯的豐富無限性和可擴展性特點,為了提高語音識別的準確率,必須對人名、地名、新詞語等專業詞語事先限定,把詞匯做入電腦語料庫里,但是實際操作起來不現實。例如用語音識別記錄即將召開的黨的十六大代表發言、討論內容,往往不可能讓所有的代表都來事先對麥克風把發言內容說一遍,適應一下口音,把相關詞語事先錄入進去,這樣的話,就變成了現在是開會了。
6、信息化現代化、信息國際化的社會發展進程出現了一種新的語言表達方式--中英文語音信息混合表達的現象,而且正在成為一種發展趨勢。比如``上海 APEC會議``、``WINDOWS98/XP系統````請王秘書把客戶的合同草案fai ke si(FAX)或E(E-mail)過來``,文秘速記人員在記錄時,只要能夠聽得懂英文單詞,就可以把它即時翻譯記錄成``請王秘書把客戶的合同草案傳真或電郵過來``;另外,當些外來詞語傳入我國時,因為是前沿話題,一時半時人們還找不到一個合適的中文詞語和造出一個新詞詞來代替,同樣會出現中文信息和外文信息混雜的情況,讓語音識別軟件去識別成全中文信息呢還是中外文混合信息呢?準確率能夠達到多少?這也有速記文秘人員提出了新的挑戰,成長為一名優秀的文秘速記人員僅僅具備很高的記錄速度是遠遠不夠的。
7、電腦速記技術是語文現代化和中文信息處理的一個組成部分,漢語語音信息國際互聯網上同步字幕直播的高效率成為現實。無論是手寫速記還是電腦速記,都是以漢語拼音方案為基礎的,是深深植根于漢民族語言的技術,隨著漢語的發展而發展,只要說漢語就有用速記存在的地方,而說別的語言又會變成別的語種的速記了。信息社會越發展,越需要處理信息的高效率,中文電腦速記技術正是這樣一個記錄、處理語言信息的高效率手段,它的出現與被應用,正是信息社會發展的必然產物和人們處理信息高效率的必然趨勢。
總之,語音識別技術和電腦速記技術工作方式方法具有本質的不同,一個是機芯在工作,一個是人腦在工作,是人腦對語音信息的再創造。語音識別無論怎樣智能,也無法取代人腦的智力
編輯推薦:
更多關注:秘書資格考試報名時間 秘書資格報考條件 秘書資格考試科目
(責任編輯:中大編輯)