人工智慧開發語音coding工具 不用雙手照樣寫程式! 對於「語音輸入法」大家想必都不陌生,現在的手機通常都會內建語音輸入,方便在無法使用雙手打字時有另一輸入文字的方式。 即使市面上已有許多語音轉文本技術,但能「輸入程式碼」的語音輸入法,過去卻還沒有人成功研發出系統化的應用程式。直到日前,有位資深美國工程師 Matt Wiethoff 成功用人工智慧(AI) 開發出一款可以「邊說邊寫程式」的工具! ▲ 使用語音輸入程式碼的 AI 工具「Serenade」介紹影片
運用機器學習技術 AI 讓你用「說」的也可以寫程式
▲ 長期寫程式容易手酸,美國工程師開發能輔助語音 coding 的人工智慧(source:Danial RiCaRoS on Unsplash/示意圖本文無關)
對工程師們來說可謂是「雙手萬能」,彈指之間能編寫出千變萬化、各有所能的程式軟體;但相對而言,若突然某日不便使用、甚至無法使用雙手該怎麼呢? 知名美國知識問答網站 Quora 的開發人員 Matt Wiethoff 就是雙手遭遇變故。他的手部因嚴重「重複性壓力傷害」所苦──這類傷害多因在日常工作中不間斷地反覆運動固定的部位所導致,嚴重的話可能對身體部位造成永久性損傷。 Matt 因此無法再使用雙手敲打鍵盤,但身為一個工程師,無法 coding 怎麼行?在職業生涯可能畫下句點的壓力之下,Matt 卻沒有灰心喪志,宛如勵志電影般,在人生遭遇重大打擊時不但沒有被搏倒,反另外開闢出一條蹊徑:開發不需雙手可以寫程式的工具。 Matt 和 Tommy MacWilliam 共同創立了新創公司 Serenade,用人工智慧開發出一款可以將語音轉化為程式碼、用口頭發聲就能寫程式的工具。
編寫程式或將因 AI 進入「聽寫時代」 或許有人會認為 Serenade 的市場很狹窄、僅供雙手不便的人使用,可是 Matt 不這麼認為。 他們認為,現在的 Serenade 只是個起點,最終將擴展到讓所有人都會使用:雙手不便的人、想讓手腕休息的人、通勤趕工的人、躺在床上突然得到靈感的人,都會使用 Serenade。「這就是 coding 的未來,這就是我們的願景。」共同創辦人 Tommy 表示。 Matt 相信,借助人工智慧,寫程式將變得比以往更快、更輕鬆,也會更有生產力,或許有朝一日,語音輸入程式碼會成為每位工程師的必備工具。
以西洋棋賽為主題的 Netflix 影集《后翼棄兵》近來大受好評,其中刺激精彩的棋局對弈,不但讓這齣劇高佔台灣熱門排行榜第一名,也讓原本對西洋棋不了解的觀眾產生興趣、紛紛探查起這個歷史悠久的二人對弈遊戲。而西洋棋——這個世界上最流行的遊戲之一,現在正遭受人工智慧的破壞與威脅?而前西洋棋世界冠軍又正和 AI 聯手拯救西洋棋?
▲ 現在的西洋棋比賽,贏家幾乎都是人工智慧。(Photo by Felix Mittermeier on Unsplash)
人工智慧與西洋棋的愛恨情仇 西洋棋在世界各地有數以百萬計的粉絲,而編寫出一個能與人類對弈的軟體程式,曾是科學家追求的目標。 首個挑戰人類棋王的電腦系統為 1997 年 IBM 的「深藍」(Deep Blue),更成為首個在標準比賽時限內擊敗人類冠軍的電腦系統。其後依然有數次「人機大戰」,但人類始終難以在 64 格的天地裡戰勝電腦。 到人工智慧公司 DeepMind 的 AlphaZero 登場時,AI 只是憑藉自我對弈的不斷學習,在完全沒有輸入人類的棋譜、沒有特別設計的專用計算程式的情況下,就已經征服西洋棋、將棋、圍棋等最複雜的棋類遊戲,打敗這些領域中最頂尖的人類玩家了。 在科學家們將 AlphaZero 稱為「深度學習 AI 的終極解答」、欣喜於人工智慧技術的快速進步時,另一方面也有人開始擔憂 AI 正在毀滅這些棋類遊戲——因為棋手們開始死記硬背 AI 的下棋手法來擊敗對手,讓棋類遊戲失去了原先的美麗。 前西洋棋世界冠軍克拉姆尼克就是憂心忡忡的其中一人。不過,他現正與開發 AlphaZero 的DeepMind團隊合作,嘗試開發出西洋棋的若干變種形式,試圖找回棋類遊戲的迷人風采。
AI 檢測咳嗽時異音 找出 COVID-19 無症狀感染者 而在疫情爆發後,研究團隊開始將此技術運用在新冠病毒的篩檢上。團隊一共收集了多達7萬個聲音樣本,來訓練即將迎戰新敵人的人工智慧模型,每個樣本皆包含數次咳嗽的聲音,其中有2500個樣本來自於確診者。蘇比拉納表示:「在醫療領域,這是迄今為止最大的咳嗽數據庫了」。 接著團隊在 1,000 個樣本上測試此 AI 模型,其中樣本有一半為健康者的咳嗽聲,另一半為確診肺炎者的咳嗽聲。在測試中,人工智慧準確地辨識出 98.5% 的確診患者,且辨識出 100% 的無症狀感染者,展現令人歎為觀止的準確性。
▲就算是新冠患者未表現出圖中的症狀,人工智慧演算法仍可從咳嗽聲辨識無症狀感染者。 (示意圖,與本事件無關/Photo by UN Response to COVID-19 on Unsplash)
論文共同作者之一的蘇比拉納表示:「即使患者看似無症狀,一旦染上 COVID-19,其產生聲音的方式也會發生變化。」但他同時也強調,雖然該 AI 能夠檢測出不健康的咳嗽聲,但依然需謹慎使用,因為該工具是以「篩選條件」的方式找到相符的疾病,因此也可能出現偶然地完全符合篩選條件,卻不是 COVID-19 的狀況,不論是個人或醫療人員都須謹慎判斷。
團隊盼推出檢測 APP 民眾在家也可免費自我篩檢 ▲團隊盼能開發出應用此 AI 的免費應用程式。 (Photo by Brian McGowan on Unsplash)
目前團隊正在與多家醫療機構合作,以利建立起更多元的數據庫,使預測更精準。 除此之外,研究團隊也正嘗試開發出應用此 AI 的免費應用程式,如果獲得 FDA(美國食品和藥物管理局,Food and Drug Administration)的許可,接下來團隊將會與私人企業合作,開發手機 APP。該 APP 將可能成為一個免費、便捷、居家性的病毒預先篩檢工具,特別是能夠識別出無症狀感染者。使用者可以將咳嗽聲以手機錄製後,上傳提供 AI 分析,就能得知是否有被感染的可能性,再進行正式的新型冠狀病毒篩檢。 蘇比拉納表示:「如果每個人在去教室,工廠或餐廳之前都使用該診斷工具,則該組診斷工具的有效實施可以減少大流行的傳播。」 長期關注人工智慧相關議題的作家和演講家卡倫姆‧柴斯(Calum Chace)表示,這個能通過咳嗽聲音辨認新冠病毒疾病的演算法是「AI 人工智慧的經典範例」,他過去也曾就 AI 對人類帶來的衝擊提出警告,但這一次柴斯表示:「這是運用 AI 幫助人類的一個好例子,單就這件事來看,我看不出 AI 會帶來什麼危險。」 也許,AI 將能成為阻止疫情擴散的最大助力之一。
人工智慧現在可從人的咳嗽聲中,認出對方是否為新冠肺炎患者──就算是無症狀患者,也能被辨識出。在目前全球疫情尚未趨緩之際,AI 可說是為新冠病毒的檢測帶來新希望! 美國麻省理工學院(MIT)實驗室日前發表一篇論文,表示他們開發出的最新 AI 演算法,只要聽到人的「咳嗽聲」,就能知道這個人有沒有感染新型冠狀病毒。重要的是──這個方法對檢測出無症狀患者特別有用。
▲ MIT 新開發的人工智慧演算法,光聽咳嗽聲就能辨識新冠患者──包含無症狀患者。(示意圖,與本事件無關/Photo by UN Response to COVID-19 on Unsplash)
新冠疫情依然在全球多國延燒,有越來越多證據顯示,在新冠病毒感染者中「無症感染者」佔了相當大的比例。這些沒有發燒、咳嗽、四肢無力等明顯特徵的無症狀感染者,因接受檢測的機會遠遠小於有症狀的感染者、難以及早接受治療,故可能持續傳染給他人,成為疫情防堵的最大威脅。 而近日,麻省理工學院(MIT)實驗室公開表示,他們利用 AI 成功開發出一種冠狀病毒檢測的新方法。 該方法的關鍵是分析人的「咳嗽聲」。MIT 研究人員在電氣電子工程學會(IEEE)的《醫療生物工程》(Engineering in Medicine and Biology)期刊上發表一篇論文,文中表示他們發現無症狀感染者發出的咳嗽聲、與身體健康的一般人有所不同,或可幫助協助辨識出感染病毒的患者,使預篩變得更加容易。雖然人耳無法辨認這種細微的差異,但人工智慧 可以。 在此篇論文中,研究人員明確表示,他們已經開發出一種能辨識新冠肺炎患者咳嗽聲的人工智慧。
▲新冠患者就算是無症狀,發出的咳嗽聲也會與一般人不同。人類無法辨識其不同之處,但人工智慧可以。(示意圖,與本事件無關/Image by Mary Theresa McLean from Pixabay)
研究團隊訓練了稱為「ResNet-50」的神經網絡,用 1000 多個小時的語音資料集訓練,以辨識區分不同強度的聲音。有研究成果表示,聲似「mmmm」的發音可以顯示出一個人聲帶肌肉的狀況,AI 可以根據其中細微的不同,判斷出是否有呼吸道症狀。 之後,團隊訓練了第二個 AI 模型,用來區分言語中明顯的情緒狀態。因罹患疾病、神經系統較脆弱的人,表現出沮喪、憂鬱比表達快樂的頻率更高。研究人員是透過蒐集演員表演的資料集來開發出「語音情緒分類器」的模型,讓 AI 得以辨識如平靜、快樂和悲傷等從聲音流露出的情緒。 接著,研究團隊訓練了第三個 AI 模型,專門辨別肺部和呼吸功能的變化。 最後,該團隊將這三個模型結合在一起,並多編寫一種檢測肌肉退化的演算法。團隊試用這組結好的 AI 模型,辨識包括阿茲海默症患者在內的人聲錄音。他們發現,與舊有的 AI 相比,新 AI 可以更好地識別出患有阿茲海默症的聲音樣本。 結論表明,聲帶減弱、語言情緒、肺活量、呼吸功能以及肌肉退化這四個面向是診斷的要點,同時也可用來檢驗是否罹患 COVID-19。