本地即時字幕-AI落地第一步

本地即時字幕-AI落地第一步

本地即時字幕-AI落地第一步,終端設備的語音辨識技術,應該是AI實現的第一步,包括:本地即時字幕是什麼、情色影片應用、各國影視字幕、AI PC 第一步、本地電腦語音識別、電腦終於懂剪片。另外,內文也附上youtube影片版本。

本地即時字幕-AI落地第一步

本地即時字幕 影片

本地即時字幕|AI落地第一步

hello大家好
我是有三高的亞瑟
今天我們來談的主題比較不一樣
而且也是趕鴨子上架的
那就是本地即時字幕
那它應該是AI落地的第一步
為什麼會提到這個概念
往後的幾天
今天是2024年5月21號
往後的幾天呢
我們會有很多的新的AI的進展
包含了明天ai pc會首發
大家會碰到實機
然後24號 輝達也有新的財報
然後6月5號的時候呢
這個台北國際電腦展
也會有一個新的一個展示對AI的進步
那所以說
如果我現在想要討論這個議題的話
在今天就要丟出來
這樣才不是馬後炮

所以我們今天來談本地即時字幕
是AI落地的第一步
在談這個之前
我先講一下我自己的立場
對於我而言
我不是工程師
我也不是很厲害的人
我只是一個使用者
站在這樣子的背景下面來看AI的發展
所以我的觀點
可能會和那些大神們不太一樣
比較著重於實際上的應用

本地即時字幕 是什麼

本地即時字幕-AI落地第一步

那我們就開始切入
這一次的第一個話題
那就是本地即時字幕
我們的電腦會在我自己這一端
把影片裡面的語音轉成文字
而且是即時的
而且呢這個轉文字的當下
它不是把語音送去遠端伺服器轉
而是在我這部機器轉
換句話說
也就是在沒有網路的情況之下
我的手機或是我的電腦
要有能力可以把我們現在聽到的語音
及時的轉成文字字幕
而這個部分
我認為是AI實現的
第一步而且是可以賺錢的第一步
為什麼這麼講
那就要講到我們阿宅的需求

情色影片應用

本地即時字幕-AI落地第一步

到這邊
18歲以下的可以閃一邊啊
任何一個新的技術
很多時候都是跟
情色需求跑第一有關
如果說今天我們的本地電腦
它可以去識別語音
而且給上那個字幕的話
那麼我們在看各國影片的時候
就可以把影片裡面的對話
你不管是日文
韓文英文或是歐洲任何文字
我們都可以把它有一個字幕譯出來
放在下面

一旦有了字幕之後
在色情行業的應用上面就非常廣了
這個時候直播就可以無遠弗屆
然後甚至是一些跨國的情色影片
也可以無遠弗屆
更甚至
這個直播主哈
在直播的時候
如果說你聽得懂他在講什麼的話
那時候會更進入情況
所以我覺得本地即時字幕這是最厲害
最可以立刻導入現在來賺錢的
這是第一步

各國影視字幕

本地即時字幕-AI落地第一步

那從之後開始
還會有第二步
第二步就是適用於所有的人
例如說追劇
如果說本地即時字幕
可以通用到所有人身上的話
這個時候那些哈日族 哈韓族
他都可以及時的去看當地的電視
你可以把當地的電視台的
甚至是有線電視台
無線電視台的資料抓進來
或者是YouTube也好
我就不用透過翻譯
也不用等字幕組
我直接可以拿到影片
之後就可以有自己有自己的subtitle
就是字幕

只要有影片
只要有檔案
我們就可以看得懂它在講什麼
但奇怪的為什麼之前不這麼做呢
之前為什麼會有翻譯檔的限制呢
它如果原本是日文的劇本
你要把它翻成中文
然後在中文世界播放的時候
是要另外取得授權的
如果說今天
所有的人都有本地字幕的話
那麼這是使用者自己的行為
把聽到的聲音翻成我們的字幕
這個時候就不會受到字幕版權的限制
而可以通行全世界

AI PC 第一步

本地即時字幕-AI落地第一步

所以本地即時字幕第一步落地的時候
將會是阿宅
技術阿宅要看動作愛情片
這些阿宅買電子設備
應該是不會手軟的
而且他們也願意買電腦
所以說過幾天要上市的AIPC
對他們而言就很有益處
我們看一下最近的新聞
像是在今天是5月21號
今天就有新聞貼出來說華碩要推AIPC
我們原本的電腦
如果是搭配Intel的CPU或AMD的CPU
再配上4090的顯示卡
就達到消費級最頂端的PC
基本上它的算力大概在70TOPS

TOPS這是一個對於
AI運算的一個衡量標準
如果今天沒有這個4090的顯卡的話
可能一個CPU的那個AI運算能力
可能只有4-5 tops而已
所以變得很弱
那現在要它強化
很簡單那就是由這個高通處理器
arm的處理器
或者是以後可能會聯發科處理器
裡面多加一些NPU的成分在裡面
它就可以把這個AI運算的能力變加強
所以我們可以看到
華碩21號就今天舉行的
線上發表會
那麼他們這一次
因為搭載的是高通的CPU
所以特別對於AI做一個優化
所以它的這個算力
就可以已經可以達到所謂AI PC的能耐

這些硬體廠商
他們在一年前就規劃這樣子的路子
那當時以當時的算力
以當時的線上語音識別來說
40TOP的本地算力
才足夠把本地的語音轉成字幕
及時呈現
但是其實現在因為這最近不斷的進步
不斷的進步
其實語音轉文字的能力
已經有大幅的實現了

本地電腦語音識別

本地即時字幕-AI落地第一步

我們來看一下現在的實際應用
各位看一下螢幕上這個軟體
叫做MacWhisper
因為我是用蘋果的時候
大家走這個蘋果路線
可實際上類似的軟體也有PC的路線
它跑的更前面
它本身就可以做語音轉文字的動作
而且速度還蠻快的
我舉了一個例子來看
好像是我最近前陣子上的一個影片
它本身的時間總時長是14分鐘
用本機去識別我的語音的話
大約只需要一分鐘就可以做出來了
也就是說14分的影片
它只需要1/14的時間就可以把它做出來

如果說一個系統或是一個播放器
它只要提前個一分鐘去讀取我的影片
那就足以我電腦
去翻譯出一個勉強可以用的字幕
有興趣的可以看下這個字幕
其實它的準確率應該有個80%啊
這樣子的字幕
其實已經足以讓消費者
足以讓娛樂性的消費者得到滿足了
所以這樣子的字幕
品質其實對我們來講是不夠的
對於我們做影片來說是不夠的
我們需要可能九成以上
九成五的達成率

但是對於一般娛樂用的消費者而言
其實字幕有個八成准就很開心的啦
當你追劇也好啊
你看直播也好啊
或是你看外國的影視劇啊
或跟別人聊天
這有個8成就很開心的了

電腦終於懂剪片

本地即時字幕-AI落地第一步

一旦本地電腦
Local端擁有了即時字幕的功能之後
接下來還會有很多不同的發展
可以發展下去
會在商業上造成的影響
應該是我覺得應該是在PC那方面
在window那邊
目前的其實這麼的能力不是很強
因為CPU本身沒有足夠的AI能力
目前看起來高通跑的比較快
接下來應該聯發科也會出來了
那他們就會讓那個window的電腦
也會擁有本地即時字幕
等到這個世界打開之後
我們就會有一些更進一步的應用

例如說像我們做影視
像我們做短片的
我們直播的時候
就可以有自帶的這個即時字幕了
就不需要事後再翻譯了
第一個第二個
當我們在做影像編輯的時候
這個時候
我的影像編輯軟體
才終於能夠瞭解我在講什麼
所以如果我講錯話重新講
或是我吃螺絲重新弄
或者是一些不重要的語助詞
大家都可以智慧的
自動辨別的方式把我剪掉
也就是說所謂的自動剪片
應該會在本地即時字幕功能擁有了之後
自動剪片功能才可以真正的實現

換句話說
以後我可能拍完片之後
就不用花這麼多時間剪片了
根據現在的基本算法
一分鐘的影片需要一小時的剪輯時間
那如果說AI即時字幕可以帶進來
那就可以有AI幫我做順剪
甚至可以AI幫我上字幕
或是AI幫我做換場
對我們動作一換
這樣子換場 這樣上字幕
那所以我自己覺得
本地即時字幕才是AI目前最快最新
第一步可以達到賺錢的方法

如果錄的順利的話
我們下一集
我想來談這個本地即時字幕
目前有一個非常成功的
利用客戶訓練自己AI的方法
嗯好下期見拜

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端