AI Agent 到底是什麼 20241225

AI Agent 到底是什麼 20241225

AI Agent 到底是什麼 20241225,AI Agent 到底有多厲害?從簡化繁瑣工作到輕鬆搞定數據分析,它已經悄悄改變我們的生活!不管是 Google Gemini 、微軟 Copilot 的辦公神器,還是 ChatGPT o1 的語音圖像識別,AI 正快速進步。

AI Agent 到底是什麼 20241225

AI Agent 到底是什麼 影片

AI Agent 到底是什麼
其實我自己也很迷糊
以前講的是一套
現在講的又是另外一套
而且最近媒體又一直在報AI Agent
那我們今天就來好好研究一下
到底什麼是AI Agent
以及目前進展到什麼程度

啊對了
我是亞瑟 我有三高
週一到週五
每天日更這個頻道
會分享我每一天學到的點點滴滴
所以這是我的日記
如果你有興趣 那我們就開始吧

傳統AI Agent定義

AI Agent 到底是什麼 20241225
  • 設計成自主運行AI系統
  • 感知環境與決策能力
  • 模擬人類思維與行動
  • 成為多任務的超級助手
  • 僅存在於學術研究中

https://www.theverge.com/2024/10/10/24266333/ai-agents-assistants-openai-google-deepmind-bots

AI Agent
其實在最一開始的時候
它的定義是非常廣泛
而且非常宏大的
它被設計成
是一種能夠自主運行的AI智能系統
它可以對環境的感知
而且還可以根據外部不同的條件
進行決策跟判斷
甚至還具備自我學習的能力
嗚~好可怕

這樣的系統呢
就是要去模擬人類的思想 人類的行動
而成為可以執行多個超級任務的超級助手
說實話
這樣的概念其實和我們現在所期待的
AGI 通用人工智能
或者是超級智能系統
其實有點類似

但是我們必須得承認
這個想法提出的很早
可是它實現起來卻有很大很大的難度
現在都很難實行啊
因此在最初的時候
AI Agent只是存在於學術研究
或是一些特殊的論文當中
實際上是沒有真的被實現過的
不過這幾年有一些改變
接下來我們就來談談
這幾年有哪一些變化

目前AI Agent定義

AI Agent 到底是什麼 20241225
  • 從理想化轉變為實用化
  • 解決實際問題與輔助人類
  • 充當人類與AI技術的橋樑
  • 不再取代人類而是協助
  • 2025年可能迎來突破

https://www.bnext.com.tw/article/79720/what-is-ai-agent

現今的AI Agent已經從很早期
那種非常強大的人工智能為假設的概念
逐漸轉變成一種更加實用的角色
現在我們可以把它當作是智能代理人來看
所以現在不再追尋這個什麼
自主決定、自由判斷
而是更專注去解決當下的實際問題
成為我們人類的一種輔助工具

現在的AI更注重於
要去連接人類的需求還有AI技術
它充當了這兩個介面的橋樑
無論是透過文字、數位
或是人類說話或表示的介面
讓我們可以很輕鬆地
把傳統的介面跟AI技術融合在一起

和傳統定義不一樣
現在AI Agent的目標
不再是取代人類了
現在的目標是要去扮演輔助的角色
協助我們去省去一些
繁瑣的機械化的固定式的操作
例如說打字、比對資料、搜尋、識別、翻譯
這些無聊的工作

AI Agent現在是智能代理人的角色
因此隨著AI模型的進步
在2025年也許將會是
AI Agent大放異彩的一年

Google Gemini 2.0

AI Agent 到底是什麼 20241225
  • 多模態理解文字圖像音訊
  • 能執行購物訂票等日常任務
  • 目前功能僅在展示階段
  • 手寫識別與數位化進步顯著
  • 成為AI Agent雛形的領先者

https://blog.google/intl/zh-tw/products/explore-get-answers/google-gemini-ai-update-december-2024

接下來我們來看一下
Google Gemini最新的突破
Google最新推出的Gemini 2.0
它是一個新的AI模型
這個模型的目的是要去提升
人類跟AI之間的互動
所以它最大的亮點 所謂的多模態
多模態的理解能力
它同時可以處理文字、影像
還有音訊的輸入
可以讓人類跟AI的互動
變得更自然也更靈活

當然Google Gemini最重要的亮點之一
就是它的AI Agent功能
在Google的展示裡面
它們展示了Gemini可以主動去執行任務
例如說它可以幫你買東西、訂票
甚至還可以推薦你娛樂活動之類的
真的像是一個活生生的智能助手一樣

不過要注意的是
這些功能目前還沒有正式開放給一般人使用
現在都還在展示的範圍之內
那我自己想應該是涉及到一些消費安全的問題
或是個人隱私的問題
所以這部分還沒有放出來
那我們未來可以來討論
AI Agent有關於消費、
隱私跟個人安全的範圍

另外Gemini在手寫字的辨識
還有轉換方面也有很大的進步
尤其是會議紀錄或是文件整理的時候
它可以把手寫的筆記直接數位化
直接送進AI裡面去
那這部分對傳統的文件數位化
跟轉換有很大的幫助
等於說它等於是結合了NotebookLM的優勢
目前看起來Gemini已經算是由AI Agent的雛型了
可以說是這方面的先驅喔

微軟 Copilot

AI Agent 到底是什麼 20241225
  • 整合Office生態系工具
  • 處理文稿數據分析與簡報
  • 計劃減少對OpenAI的依賴
  • Excel複雜辨識仍有挑戰
  • 辦公室AI Agent前景可期

https://news.microsoft.com/zh-tw/agents

接下來我們來看微軟
微軟的Copilot目前也有新的發表會
它最厲害的地方就是深度整合了
Office的生態系
成為一個強大的工作輔助工具

例如說我們在Word裡面
可以讓它去幫我們撰寫文稿、生成文字
在Excel裡面它能夠自己幫我們分析龐大的數據
能幫我們自動生成圖表
幫我們做整理
也可以簡化資料變成視覺化的一個過程
另外在PowerPoint裡面
它甚至還可以幫我們快速的生成簡報檔案
讓我們做簡報更方便

微軟最近也宣布
他們有計畫要逐步擺脫對於OpenAI的依賴
所以他們要開始建立自己的AI模型
也可以讓企業在運行Copilot的時候
那個費用可以變得更低、更合理
我想這一點對於AI的商業化
它的普及是非常重要的

但是坦白說
Copilot目前還有一些方面是有些限制的
尤其是它對Excel跟Word的理解有問題

舉個例子來說
我們人類在使用Excel的時候
常常會填入一些亂七八糟的數據
或在不正確的格子上填入數據
或是隨便合併格子
那人類看起來是OK的
可是電腦看就有問題
所以目前看起來
AI對於一些複雜的資料表的內容
混亂的資料表的內容
AI的辨識能力還有待提升

即便是如此
Copilot也已經展示出
它在辦公室上面的潛力了
我想比起生活上的AI agent
辦公室的AI agent可能會更快成熟
因為光是滿足商務的需求
就已經是一個非常大的市場
可以直接收錢了
它的獲益是可以保證的
那當然有利可圖會進步得更快

ChatGPT o1

AI Agent 到底是什麼 20241225
  • 多模態交互能力顯著提升
  • 處理文字語音圖像輸入
  • 圖片分析與手寫識別進步
  • 語音識別連貫性提升
  • 影像識別能力有待增強

https://www.gvm.com.tw/article/115694

接下來要回到Chat GPT o1
這個模型裡面啦
o1是目前OpenAI最新的模型
它的目標非常明確
就是要做一個多模態的助手
那現在的功能算是有很大的進步啦
例如說它現在可以同時
處理文字、語音跟圖像的輸入
這讓它在很多場景上面都變得非常實用

雖然現在的能力沒有這麼強
但是它是目前當下
唯一可以拿來做實用的
所以也算是跑得非常快的了
這一次的進步主要是在
圖片的分析上面進步非常大
它已經能夠幫忙把紙本的資料轉成數位化了
而且還可以去辨識一些畫面裡面的內容
可以告訴你這個圖裡面發生了什麼事情
甚至可以提供一些相關的建議

另外,ChatGPT最近在手寫字的轉換
跟語音辨識的能力上面也大大增強
甚至做會議記錄、文件整理這些事情呢
現在可以處理得更好、更準確
尤其是語音識別
現在還可以根據上下文提供更連串的回應
更連串的修正
算是非常非常厲害的

但不代表它沒有壞處
壞處就是目前什麼都看起來
好像還是有點笨笨的沒這麼聰明
而且影像辨識的能力還有一些限制
我自己實驗的結果發現
可能是為了要控制這個資源不要被耗盡
所以它在影像辨識上面設了很多的限制
但是我想隨著硬體的進步
隨著價格越來越低
未來的影像能力一定會越來越強
也開放給各位隨便使用的啦

因為影像辨識是
AI agent非常重要的一部分
一旦AI agent可以理解
我們所看到的世界的時候
它就可以幫我們做更多的事
可以提供我們更多的協助
或者是直接幫我們執行一些任務
這個是AI agent非常重要的一部分
也是ChatGPT o1這一次
有大幅進步的部分

AI Agent 未來影響

AI Agent 到底是什麼 20241225
  • 改變生活方式與工作流程
  • 簡化繁瑣操作提升效率
  • 改變軟體服務的生態結構
  • 降低小型企業數位化成本
  • 未來應用場景將快速擴展

https://www.businessinsider.com/ai-job-market-to-grow-2025-employers-hiring-talent-tech-2024-12

最後來到結語的部分
大概談一下AI agent的影響
AI agent普及之後
我想我們真的會很多事情會徹底改變
尤其是我們的生活方式跟工作流程
因為它最大的特點就是能夠
把一些複雜的工作給簡化
直接去執行我們的需求
而省去中間非常多的步驟

例如說我們要快速處理
一份實體的文件的時候
我只要拿出手機拍照 拍給AI
它就可以把照片轉成文字
它可以幫忙整理內容裡面的圖片
文字或詳細的資料
幫忙生成一個簡單的大綱
這樣子就可以有非常高的效率

更重要的事情是
AI agent的出現也會
改變整個軟體服務的生態
像是以前我們會需要靠代理商
或是軟體的中介商
來幫我們完成一些數據化
或是數據分析的工作
但是有了AI agent之後
這中間的環節都可以全部省去

我舉經營指甲店的
這樣子小型商業的例子來說
我們以前就要用人工的方式
一筆一筆的去輸入消費紀錄到軟體裡面去
但是現在我只要把 Excel 的表格
或是把我手寫的紀錄拍照 上傳給 AI
AI 就可以自動幫我完成整理跟計算
甚至還可以直接幫我生成每一個月的損益表
這樣子的話不僅降低了我們營運的成本
也可以讓中小企業快速的 AI 化
而跳過了傳統的數據化時代

而且 AI agent 的應用範圍
應該不只限於商業領域而已
我想它在家庭、醫療、教育方面
也都會帶來非常大的改革
我們可能會看到一些全新的應用
這些應用會去解決一些我們過去
想都沒有想過可以立刻解決的問題
所以在未來這個技術的進展速度
有可能會非常快
甚至可能會顛覆我們對於軟體服務
跟軟體的傳統認知

那我自己的預估是
台灣的軟體商可能會賺不到錢
但是傳統的電腦廠商
可能會因為這樣子而迎來一個新的硬體春天

好啦,那今天的分享就到這裡
有機會的話
我們在後面會繼續多聊一些AI的發展跟應用
繼續探討AI agent
能夠有哪一些突破跟發展
還有哪一些股票可以做投資
那感謝各位看到這 掰啦,明天見

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端