記者實測Gemini Live廣東話對答!鏡頭分享功能強但咬字「葵芳味」太重?語音轉錄/翻譯/撮要重點真實體驗

文: 李加傑
3小時前

AI|Gemini Live|使用AI工具查嘢搵資料真係幾方便吓,不過有時候喺手機上面見到一啲內容想查,好可能要截張圖或者打段字畀AI,如果係有大量資料嘅話,下下咁轉嚟轉去確實就冇咁方便喇!Gemini AI就有不同的玩法,皆因它有一項叫「Gemini Live」的功能,可以透過語音形式直接互動,在此之中更有鏡頭及螢幕分享,讓Gemini查看畫面,只要再用語音就能輕鬆得到想要的答案,不過在Gemini Live使用廣東語交流效果是否良好?得出的答案是否有用?是否真的方便?這次編輯就實測一下,看看能不能提升我們的使用體驗!

AI|Gemini Live利用語音即可交流

Gemini AI的用途很多,能簡化不少諸如找資料、製圖,以及翻譯等工序,但很多人在用它時,還是只會透過打字及匯入圖片影片的方法來作為指令,這樣都會浪費不少時間。事實上,Gemini在手機App上還有一個叫「Gemini Live」的功能,使用它就能直接利用語音與其交流並得出想知的資訊,這樣哪怕是有很多資料要處理,或是雙手都沒有空時,仍能利用Gemini得到答案。

AI|Gemini Live使用限制

不過Gemini Live仍有一些使用限制,最主要的一點就是只能在手機及平板App上使用,電腦及手機上的網頁版本仍未支援該功能,所以用開電腦、不下載手機App的用家們,暫時只能望梅止渴了。另外,這功能對於講廣東話的朋友來說也不算友善,因為其廣東話語音並不標準,充斥住滿滿的「葵芳」味之餘,在把語音轉錄至文本時亦有很多錯字。

AI|Gemini Live鏡頭及螢幕分享實測

整體上Gemini Live能理解我的指令並作出回應,而作為Gemini Live的兩大賣點,鏡頭及螢幕的分享效果又會如何呢?

鏡頭及螢幕分享實測|翻譯英文至中文

我就先簡單地找了一篇英文讀物《The Necklace》,然後透過語音直接叫它翻譯成中文,看看有沒有效(詳情請看下圖)

而結果顯示,使用鏡頭及螢幕分享後,給予的指令確實能被執行,問題在於轉錄多錯字,且第一段的翻譯明顯有問題,用普通的Gemini AI去翻譯時,整個效果都明顯不同,而且顯示上亦不便令人看得頭暈。更甚者我用鏡頭轉錄時還要擔心自己的手會不會太震,所以想翻譯還是別用Gemini Live這功能會好一些。

鏡頭及螢幕分享實測|資料整合

雖然只用鏡頭及螢幕,比較難一次將所有內容直接給予Gemini Live處理,但我們應該能從所看到的資料中進行一些簡單的整合。這裏我就找了U Lifestyle的私隱政策來總結一下內容(詳情請看下圖)

就結果而言,它能分析出我給予的內容是甚麼,而且給出相應的資料簡單概括,然而可能是畫面內資料太少的問題,所以這個簡單的概括確實「簡單」了一點。至於把語音轉錄成文本的效果如何,就看各位是否能接受了(詳情請看下圖)

AI|Gemini Live英文及廣東話交流效果差別

最後,編輯純粹用英文及廣東話語音交流,問之前要求翻譯的文章《The Necklace》的簡單概要,除了發現編輯的英語及口語能力很差外,還能知得Gemini Live在英文的理解上會好一點,而廣東話結合英文的情況下雖然會顯得尷尬,但也能順利給出答案。然而用鏡頭及螢幕分享功能時,它所給予的答案卻會顯得比較混亂,所以就現時來說,使用英文交流的體驗或者會好很多,而想要翻譯、概括整段內容的資料,使用Gemini Live的鏡頭及螢幕分享方式就不太合適了。

資料來源:Gemini AI、Google

《U GO》請您睇《劇場版「暗殺教室」:我們的時光 》!

10週年全新篇章🎬解禁3年E班未公開回憶✨

10週年全新篇章🎬解禁3年E班未公開回憶✨

↓《Chill賞親子玩樂祭》活動攻略✨!↓

贏走主題樂園門票、酒店Staycation及人氣產品

贏走主題樂園門票、酒店Staycation及人氣產品