作者 | 程茜
編輯 | 漠影
智東西10月28日報道,訊飛輸入法又上新,這次是端側(cè)大模型重塑版!
科大訊飛的大模型底座上周官宣更新,訊飛星火4.0 Turbo七大核心能力全面超過GPT-4 Turbo,數(shù)學(xué)和代碼能力超越GPT-4o,國內(nèi)外中英文14項主流測試集中拿下9項第一。
在此之上,搭載著訊飛星火端側(cè)輸入大模型、訊飛星火語音大模型的訊飛輸入法14.0亮相,再次讓人眼前一亮。
訊飛輸入法14.0的”AI輸入增強(qiáng)“可以直接讓輸入法“猜你喜歡”,輸入上句就能秒出下句,聊天氣、游玩計劃都不在話下;在大模型的加持下,輸入法方言語音輸入即將支持多達(dá)202種;為了更契合生成式AI輸入,輸入法的界面升級活力視界2.0,除了各種功能卡片、切換動效一應(yīng)俱全,個性皮膚設(shè)置也讓視覺煥新;還有橫貫娛樂、生活、工作等各大場景的AI助手。
這一被大模型重塑的訊飛輸入法14.0,提出的“每個人的AI輸入”價值主張,已經(jīng)清晰呈現(xiàn)在大眾視野中,讓所有人都能享受AI輸入服務(wù)的可能成為了現(xiàn)實。
可以看到,大模型應(yīng)用時代,這一歷經(jīng)40多年發(fā)展原先只用于打字的輸入法,已經(jīng)在作為用戶日常工作、生活、娛樂必備交互工具這件事上更勝一籌。
在大模型走向落地應(yīng)用深水區(qū)的同時,現(xiàn)在大大小小的AI原生應(yīng)用層出不窮,但像輸入法這樣與用戶日常生活連接如此緊密,又能在不同界面隨時調(diào)用AI能力的產(chǎn)品并不多。
但如果輸入法直接與大模型簡單粗暴的相接,只能解決助力表達(dá)的一環(huán),但新的問題又接踵而至。首先云端大模型輸入服務(wù)成本高,其次用戶對生成內(nèi)容的多樣化需求難以被緊湊的鍵盤界面滿足,還有通用模型難以解決用戶垂域溝通場景的體驗,這些都是當(dāng)前AI為名的輸入法亟需解決的難題。
那么,在AI席卷我們?nèi)粘I畹漠?dāng)下,訊飛輸入法針對于上述痛點的思考是什么?輸入法如何潛移默化影響我們的日常表達(dá)?看完訊飛輸入法14.0的全面重構(gòu),我們或許可以找到答案。
現(xiàn)在不論是聽音樂、購物、點外賣…………“AI輸入增強(qiáng)”經(jīng)常能猜中我的內(nèi)心想法。你有沒有想過在聊天中,也能有一位24小時隨時待命“猜你喜歡”的互聯(lián)網(wǎng)嘴替?
這就是訊飛輸入法14.0重磅更新的本地AI化的“聯(lián)想”和“預(yù)測”功能。不過,這可并非此前輸入法中預(yù)埋的根據(jù)上文猜詞功能。在訊飛星火端側(cè)輸入大模型的加持下,我有時候只需要一句話,輸入法上就會自動生成下文的完整回答。
先來聊一下最近大家都關(guān)心的天氣。
當(dāng)我向聊天對象發(fā)出“今天好冷啊”,訊飛輸入法上方的輸入框就能自動幫我接上下一句,“多穿點衣服”、“不要著涼了”,不僅省下了輸入的時間,還能給我一些聊天靈感。
聊天氣、聊周末安排時,這些直接出現(xiàn)的短句都深得我心。
除了直接給出關(guān)聯(lián)句子,這一輸入法還能根據(jù)用戶的關(guān)鍵詞進(jìn)行“私人訂制”回復(fù)。
當(dāng)我打出“我想周末去公園”,輸入法就可以自動幫你聯(lián)想到去公園需要天氣好的時候,所以當(dāng)打出“天氣”,輸入法就會自動補(bǔ)齊句子。
晚上極度疲憊想要和朋友快速結(jié)束對話,當(dāng)你打出“我要早點睡”,訊飛輸入法上方就直接出現(xiàn)“明天要上班”的表達(dá),這時候你就可以心安理得拋下手機(jī)進(jìn)入夢鄉(xiāng)。
還有一種場景是,在下雨天手拿雨傘的你本來打字就不方便,當(dāng)你和聊天對象輸入“今天下雨了”,下半句話只要輸入“jide”的拼音,就可以直接生成“記得帶傘”的回復(fù)。
在增強(qiáng)聯(lián)想的場景中,只要你給出一個情境,訊飛輸入法就能幫你補(bǔ)齊下文。
例如想和朋友討論周末出去玩的計劃,當(dāng)你輸入“我想去公園散步”,輸入“享受”,訊飛輸入法就可以秒懂你的想法,直接給出“享受大自然,放松心情”,消除AI機(jī)械化、硬生生的聯(lián)想。
訊飛輸入法的升級,能根據(jù)用戶輸入的拼音或者開頭關(guān)鍵詞,然后結(jié)合其日常輸入習(xí)慣聯(lián)想甚至預(yù)測出一些完整的句子。
除了打字輸入,現(xiàn)在語音輸入的使用場景也越來越多?;诙藗?cè)大模型的泛化能力,離線狀態(tài)下訊飛輸入法的識別能力也直線up,識別準(zhǔn)確率基本持平云端語音輸入效果。
訊飛輸入法業(yè)務(wù)部總經(jīng)理程坤補(bǔ)充道,這一離線語音識別的功能可以讓用戶網(wǎng)絡(luò)不好時,也能實現(xiàn)完整輸入體驗。為了做到這一點,他們用大模型將離線語音功能重寫,他認(rèn)為,這也是未來針對用戶做個性化輸入的基礎(chǔ),能結(jié)合用戶的本地輸入習(xí)慣。這意味著,離線的語音輸入不僅僅是在線語音輸入的補(bǔ)充,而是有可能成為用戶使用日常語音輸入的風(fēng)向標(biāo)。
無獨有偶,谷歌、蘋果、OpenAI等國際巨頭科技公司正不遺余力強(qiáng)化語音識別能力,提高其識別的準(zhǔn)確率和響應(yīng)速度。
而在中文語音識別這件事上,訊飛輸入法不斷加碼。自2010年發(fā)布以來,訊飛輸入法已經(jīng)迭代了14年。此次,訊飛輸入法14.0接入訊飛星火語音大模型,將使得方言識別種類倍增,可覆蓋近300座城市。據(jù)悉,訊飛輸入法將在“方言免切換”中支持202種方言自由說,讓每個人都能“想說就說”。這與科大訊飛在1024開發(fā)者節(jié)上發(fā)布的星火大模型的底座能力一脈相承。
在方言免切換的功能中,即使兩個聊天對象一個說方言一個說普通話,或者兩個人說不同的方言,也無需手動切換。當(dāng)我播放了一段北京話和中原官話夾雜的方言音頻,訊飛輸入法也準(zhǔn)確識別了出來。
當(dāng)然大模型賦能的輸入法能力遠(yuǎn)不止于此,更新后的訊飛輸入法還能讓AI直接橫跨你的工作、生活、娛樂社交圈。
與上司溝通、戀愛、斗圖、翻譯、校對……形形色色的場景都能讓你在輸入法中找到對應(yīng)的AI助手。
對于我而言,社交場景中最頭疼的就是工作相關(guān)的溝通環(huán)節(jié),既需要準(zhǔn)確傳達(dá)自己的意思,還要把握好和同事、客戶溝通的方式。
所以訊飛輸入法的AI助手中,我高頻使用的就是“高情商溝通”助手。
當(dāng)與同事合作完成一個項目,但項目DDL就在明天,僵硬的催促可能不是溝通的好辦法。這時候你只需要點擊高情商溝通,選擇溝通對象以及想要的風(fēng)格,訊飛輸入法就直接生成了5種回復(fù)方式,語氣詞、關(guān)鍵信息應(yīng)有盡有。
還有更為考驗情商的一個場景就是,你需要通知大家今晚加班,這時候你只需要將“今天晚上需要加班”這幾個字打出來,AI助手就能對應(yīng)生成風(fēng)趣幽默、高情商、簡單直接等話術(shù),你直接點擊發(fā)送,無需再頭痛斟酌每一個字詞。
當(dāng)下的網(wǎng)絡(luò)上的年輕人都喜歡立人設(shè),“人設(shè)立得好”等相關(guān)話題也頗有熱度!
訊飛輸入法直接將這些人設(shè)一股腦搬到了輸入法的AI助手里,不僅有霸道總裁、黛玉文學(xué)、大胖橘,還有烏薩奇等,想要立什么樣的人設(shè),AI都能幫你用“同款”風(fēng)格進(jìn)行聊天。程坤透露,短短一個多月時間,訊飛輸入法中官方加用戶創(chuàng)建的人設(shè)已經(jīng)達(dá)到1萬多個。
作為甄嬛傳深度愛好者,我主要試用了“嬛言嬛語”,即使面對現(xiàn)代色彩濃厚的“我好困,想喝咖啡”,AI助手也非常忠于人設(shè),直接穿越到了古代。
此外,除了面向C端消費者提供豐富的AI助手,針對于企業(yè),訊飛輸入法也提供了領(lǐng)域定制化的AI助手,能根據(jù)企業(yè)所屬的行業(yè)、具體的需求,讓輸入更能深入其中,幫助企業(yè)員工提質(zhì)增效。如今,訊飛輸入法已經(jīng)與友邦保險聯(lián)合定制了AI營銷助手,提供了一整套智能化的解決方案。
把大模型裝進(jìn)輸入法的最新形態(tài)已經(jīng)被展現(xiàn)在我們的日常生活中。值得一提的是,訊飛輸入法的AI能力并不局限與當(dāng)前,其創(chuàng)新采用了全新的AI插件化引擎構(gòu)架,使得輸入法可以靈活拓展多種AI模型,能實現(xiàn)廣泛覆蓋、智能融合,讓本地化的AI輸入呈現(xiàn)給更多的用戶。
訊飛輸入法正在全方位重塑中文輸入法。這除了體現(xiàn)在上述提到的功能升級,訊飛輸入法還在輸入界面以及用戶的交互上進(jìn)行了自我革新。
為了讓生成式AI與用戶的輸入更加契合,訊飛輸入法的活力視界2.0再一次亮眼的表現(xiàn)。程坤談道,活力視界2.0為輸入法中的每種服務(wù)都單獨設(shè)計了卡片,并跟其本身的功能進(jìn)行了深度結(jié)合。
同時,用戶在選擇不同功能時中間有動效切換并完成了和所有輸入法皮膚的適配。
程坤認(rèn)為,輸入法界面的重新設(shè)計,是未來輸入法提供輸入文字之外更廣泛能力必須要走的一步。
在這個趨勢下,訊飛輸入法一直走在行業(yè)前面,正如其此前率先將傳統(tǒng)輸入法的候選欄變?yōu)楣ぞ邫?,從只有備選文字變?yōu)閾碛姓Z音輸入等更多切換按鈕。
基于這種模式,訊飛輸入法集成了很多服務(wù),覆蓋了用戶輸入前、中、后三大場景。
輸入法作為用戶使用電子設(shè)備時調(diào)用頻率最高的,也是與用戶距離最近的服務(wù),相比于其他AI產(chǎn)品而言與用戶的交互也更為密切、深入。
不過,這背后程坤提到,他們遇到的難題就是,大模型訓(xùn)練、推理成本高,在高頻輸入場景為用戶提供大模型能力,對于輸入法本身而言并不是提供AI服務(wù)最好的路徑,因此要找到一個平衡點,讓所有用戶都能用上大模型同時成本降下來。
在輸入法領(lǐng)域已經(jīng)積累14年之久的科大訊飛,交出了自己的答卷。
從2010年發(fā)布業(yè)內(nèi)首個中文語音輸入法,到方言語音輸入、多方言多語種免切換輸入,訊飛輸入法不斷突破高效輸入、降低輸入門檻這兩件事的極限,在生成式AI輸入法上同樣如此。
▲訊飛輸入法業(yè)務(wù)部總經(jīng)理程坤
基于星火大模型,他們結(jié)合訊飛輸入法的輸入場景訓(xùn)練出了端側(cè)大模型,這個大模型解決了輸入過程、輸入上屏以及輸入完成之后,下一句話如何聯(lián)想的過程。
在大模型參數(shù)不再追求龐大的參數(shù),手機(jī)性能提升同時垂直領(lǐng)域大模型應(yīng)用興起的背景下,端側(cè)大模型部署成為可能,這使得輸入法與端側(cè)大模型的結(jié)合多了更多可能性和創(chuàng)新空間。
多年布局之下,訊飛輸入法已經(jīng)貫穿不同設(shè)備、不同輸入場景、不同用戶群體的個性化需求,再輔以大模型時代的生成式AI技術(shù),將這一產(chǎn)品打造的更準(zhǔn)確、更高效、更懂用戶。
輸入法與大模型的結(jié)合與其他產(chǎn)品不同,既需要符合用戶傳統(tǒng)的使用習(xí)慣,還要將新的AI能力融入其中。輸入法是用戶日常使用頻率極高的工具,人們在長期使用過程中形成特定的操作習(xí)慣和預(yù)期,同時,大模型具有強(qiáng)大的語言理解、生成和預(yù)測等能力,將這些融入輸入法需要精心設(shè)計,不能簡單地堆砌功能。而恰好,科大訊飛在技術(shù)研發(fā)和產(chǎn)品落地的耕耘已久。
在訊飛星火大模型底座之上,訊飛輸入法搭載了訊飛星火端側(cè)輸入大模型,全力支撐輸入法的拼音和離線語音輸入,同時基于訊飛星火語音大模型云端能力的快速迭代用于提升方言輸入種類和效果,將通用大模型與垂域小模型的能力充分體現(xiàn)到用戶的輸入過程之中,真正實現(xiàn)AI的交互體驗升級。
訊飛輸入法發(fā)展至今已經(jīng)14年時間,且星火大模型自去年起就成績頗豐??梢钥吹?,訊飛輸入法已經(jīng)在端側(cè)大模型時代努力打造普惠的屬于“每個人的AI輸入”。