人們透過互動交換資訊、傳遞情感,是相當直覺、輕鬆、習以為常的一件事,但背後蘊藏著大量的運作機制與文化底蘊。而要如何讓社會機器人流暢、自然地與人互動,仰賴應用人文與社會科學積累的研究成果於人機互動(human-robot interaction)上。人們在面對面進行互動時,不僅透過口語與副語言訊息(paralinguistic)交流,還藉由各種非口語訊息,幫助人們溝通與互相理解。
口語交流關注於用字遣詞、句子結構、發音。口語與書寫文字相當不同,由於口語必須即時表達出來,因此口語往往充滿了停頓、填充詞、重複的字詞與反覆修正的語句,也常出現不符合文法的句子。以現今技術而言,還無法讓機器人完整地了解自然語言,但已經有許多相關技術正在開發中。自動語音辨識(automated speech recognition; ASR)是現有已經成熟的技術,其功能在於將語音訊息轉換為文字訊息,如同智慧型手機的系統都具備的功能,讓你在懶得打字時,直接用唸的轉譯成文字。當然,口語交流遠遠超過語音辨識的範疇,人與人在口語交流時,不會將聲音辨識成文字,而是直覺地理解字句背後的涵意,並且辨認對話的狀態,以控管對話的走向。再者,伴隨口語所產生的副語言訊息,像是聲調、語速、頓點、音量、對話輪流及說話的時機點,都是能夠反轉話語訊息的關鍵因素。
非口語訊息常會伴隨著口語一起出現,即使有些非口語訊息非常地細微,但人們還是即時能捕捉到這些非口語線索,並直覺地將它們納入判斷,以辨別說話者所要表達的語義、意圖或情緒。人們擅長判斷非口語訊息,但目前的社會機器人遠遠不及人們。目前關於非口語訊息的研究中,凝視與視線移動,透露著人們可能對某事物充滿興趣,願意投注注意力至該事物上,也是最基本的非口語線索。社會機器人的凝視,也有相似的效果,當機器人能夠轉身凝視說話者,人們會認為那個機器人更加體貼 (cited in Bartneck et al., 2020)。手勢(gesture)亦是相當基本的非口語訊息之一,能夠幫助人們在表達時,指涉或演示所談的事或物,亦能輔助表達的節奏。能夠以手勢輔助表達的社會機器人,會提升人們的理解程度(cited in Bartneck et al., 2020)。觸摸(touch)也是一種非口語訊息,在較親密的關係之中常會出現,像是藉由觸摸安慰他人。而社會機器人裡,以年幼海豹為外貌的機器人 Paro,其觸感可以降低人們的焦慮、壓力(cited in Bartneck et al., 2020)。另外,還有像模仿、姿勢、移動等非口語訊息的溝通方式,也都有相關研究發現能夠提升機器人的表達能力或是被喜好程度。
在非語言、語言溝通這一塊,社會機器人目前礙於各種技術尚不充足的狀況下,還無法生產出能流暢與人自然交流的機器人。但相信在技術與研究的演進與推陳出新下,或許在不久的將來,就能看見與電影或小說那樣善於溝通的機器人。
參考資料
Bartneck, C., Belpaeme, T., Eyssel, F., Kanda, T., Keijsers, M., & Šabanović, S. (2020). Human-robot interaction an introduction. Cambridge University Press.