ChatGPT AI寫程式 PDF轉TXT工具 20250318

ChatGPT AI寫程式 PDF轉TXT工具 20250318

ChatGPT AI寫程式 PDF轉TXT工具 20250318,ChatGPT 寫程式不一定成功,這次開發 PDF 轉 TXT 工具的過程中,雖然一開始屢次失敗,但 GPT 的持續修正,讓我最終完成了更實用的功能,AI 不完美,但肯陪你走到最後。

ChatGPT AI寫程式 PDF轉TXT工具 20250318

ChatGPT AI寫程式 PDF轉TXT工具 影片

今天來談如何用AI寫程式
我們要寫一個PDF轉TXT的小工具
而且這個工具很簡單
用ChatGPT就可以做好

我是亞瑟我有三高
每週一到每個禮拜五
我都會日更這個頻道
去分享每天學到的點點滴滴
今天我們來學一下
如何用ChatGPT
寫出有意義的程式吧

成語接龍不好玩

ChatGPT AI寫程式 PDF轉TXT工具 20250318
  • 成語接龍題材無趣
  • WordPress 外掛失敗
  • 簡易部落格系統失敗
  • 決定開發PDF轉TXT
  • GPT寫得出PDF 工具

https://www.books.com.tw/products/CN11963950

這次的影片其實還是圍繞在《拐點》第五章第三節的內容,裡面提到一個用 ChatGPT 寫程式的例子。作者的範例是用 ChatGPT 3.5 和 4.0 開發了一個「成語接龍」的 Python 程式。

它的設計是這樣的:系統會隨機把成語和它的解釋打散,然後使用者要把正確的組合連接起來。這種學校裡上電腦課才會遇到的範例,說真的,只有老師授逼我做,我才會去做。

但問題來了,既然這一章要談 GPT 寫程式,那我總得想辦法做點什麼吧?中間試過寫WordPress的外掛,也式過極簡的非動態部落格系統,但是都失敗囉~

想來想去,最後我決定:來寫一個 PDF 轉 TXT 的工具。這個工具不僅實用,還能真正解決我手上的需求。而且,我相信 GPT 也應該寫得出來。

PDF 轉 TXT

ChatGPT AI寫程式 PDF轉TXT工具 20250318
  • RAG需要純文字資料
  • PDF裡雜訊太多
  • 網路工具受限且昂貴
  • 複製貼上太費時
  • ChatGPT開發轉檔工具

https://blog.csdn.net/PLANTTHESON/article/details/137690442

最近剛好在做一個需要 RAG 的專案,RAG就是「檔案檢索增強生成」(Retrieval-Augmented Generation) 的技術。這個專案需要把大量的資料放進知識庫,對我來說,這是一個很重要的計劃。

但資料來源不管是書籍還是論文,幾乎都是 PDF 檔。PDF 裡的資料內容實在太龐雜了,排版、圖表、目錄、頁碼,其實語言模型只要裡面的「純文字」而已。

如果直接把 PDF 檔拿去做 RAG,系統會記錄一大堆無用的資訊,效率反而變差,擷取最乾淨的文字,這樣才是最有效率的。

網路上雖然有不少 PDF 轉 TXT 的工具,但很多都要收費,操作上也不算順暢,還有不少功能上的限制。

在 macOS 上,直接複製PDF文字,再全部貼上就能做到轉出文字,只是書籍與論文實在太長,手工複製實在是太辛苦。

所以,我決定請 ChatGPT 幫我完成一個「PDF 轉 TXT」的小工具,這樣就能更有效率地整理資料,也讓這個專案順利進行。

明確需求很重要

ChatGPT AI寫程式 PDF轉TXT工具 20250318

和書本的選擇一樣,我也用 ChatGPT 來寫這個程式,而且已經更新到了 GPT-4o 了。

不管是 GPT-4o 的 免費版 還是 付費版,在開發這類小工具時,其實差異不大,兩者的能力幾乎一樣。

重點在於「指令要下得夠清楚」。你的需求描述得越清楚,GPT 給你的結果就越準確。因為我根本不懂 Python,所以策略就是「詳細描述需求,讓 GPT 自己發揮」。

ChatGPT AI寫程式 PDF轉TXT工具 20250318

我對 GPT 說:

請幫我寫一個 Python 程式
功能是將 PDF 檔案轉成 TXT 檔案
並請加上圖形介面 (GUI)

GPT 很快就幫我產生了一段完整的 Python 程式碼。而且直接請 GPT 幫我「打包成檔案」,這樣我就能直接下載。

GPT 甚至還貼心地提醒我,執行這個程式時,只需要在終端機中輸入:

python3 pdf_to_txt.py

整個流程感覺非常簡單,我當時心想:「應該沒問題了吧?」結果……我錯了。

AI修正程式錯誤

ChatGPT AI寫程式 PDF轉TXT工具 20250318
  • 未裝Python執行失敗
  • Homebrew安裝Python
  • Tkinter 錯誤再修正
  • 環境變數設置失敗
  • GPT 指導排查問題

執行 GPT 提供的程式時,我原本以為一切都準備好了,結果一跑……完全沒反應。

GPT 提醒我:「請確認你的電腦是否已經安裝 Python?」並要我輸入以下指令來檢查:

python3 --version

結果終端機跳出:

command not found: python3

原來,問題根本不是程式有錯,而是我的電腦根本沒有安裝 Python。GPT 指導我使用 Homebrew 來安裝 Python,指令如下:

brew install python

安裝完成後,我再次執行:

python3 pdf_to_txt_batch.py

結果……又出錯了。

ChatGPT AI寫程式 PDF轉TXT工具 20250318

這次的錯誤提示跟 GUI 介面有關,GPT 解釋說:「你的系統缺少 Tkinter,或者 Tkinter 的版本太舊。」所以 GPT 指導我執行以下指令來安裝最新版的 Tkinter:

brew install tcl-tk

但安裝完後,問題依然存在。GPT 發現是因為 Tcl/Tk 的路徑沒有加到環境變數裡。

於是 GPT 接著要我執行以下指令,將 Tcl/Tk 的路徑加入 PATH:

echo 'export PATH="/opt/homebrew/opt/tcl-tk/bin:$PATH"' >> ~/.zshrc
source ~/.zshrc

這個工具成功地將 PDF 轉成了 TXT,執行速度又快又準確。

進階版的開發

ChatGPT AI寫程式 PDF轉TXT工具 20250318
  • 原版僅支援單檔轉換
  • 擴展成批次轉檔
  • PyPDF2 解析出錯
  • GPT 改用 PyMuPDF
  • 批次處理成功快速完成

執行 GPT 提供的基礎版程式後,我發現它只能一次轉換一個檔案,這對我來說完全不夠。

於是再次請 GPT 幫忙擴展功能,我的指令是這樣的:

請將原本的 PDF 轉 TXT 程式,改成可以一次選擇好幾個檔案,支援批次處理的功能。

GPT 很快就更新了程式碼,當時我信心滿滿地執行這個進階版,結果……又出錯了。

這次的錯誤不是來自環境問題,而是 GPT 的程式碼本身有設計上的問題:

ChatGPT AI寫程式 PDF轉TXT工具 20250318

GPT 原本使用的是 PyPDF2 模組,但在遇到「加密 」或「內嵌圖片」時,會無法正常解析,所以改用 PyMuPDF 模組,安裝指令如下:

pip3 install pymupdf

這次,我再次執行程式,批次處理終於順利完成,一次可以選擇多個 PDF 檔案,快速轉成 TXT。

而且整個流程的執行速度非常快,我一次轉了 10 個 PDF 檔案,短短幾秒鐘就完成了。

修正問題的能力

ChatGPT AI寫程式 PDF轉TXT工具 20250318
  • GPT 最大優勢非完美
  • GPT 可持續修正問題
  • 一步步排查每個錯誤
  • 逐步帶著我找解方
  • 失敗是正常但能解決

ChatGPT 最強的地方,並不是「直接產生完美程式碼」,而是「帶著我解決問題」的能力。

每次遇到問題時,GPT 像一個隨身教練一樣,一步步指導我檢查系統,直到真的解決為止。

在這次的過程中,我遇到了各種問題:沒裝 Python 、沒設好環境變數、 缺少 Tkinter 模組 、缺少 PyMuPDF。

每一個問題,GPT 都能夠針對錯誤訊息,提供具體的方法來解決。

失敗是正常的,但 GPT 的強大就在於「即使失敗,也能帶著你找到正確的做法」。

與其期待 GPT 一次就寫出完美的程式,不如將它當作一個「隨時解惑的教練」,一步步請它帶著你解決問題。

更多的擴展功能

ChatGPT AI寫程式 PDF轉TXT工具 20250318
  • GPT主動提案進階功能
  • 自動優化排版去雜訊
  • 自動分章節生成摘要
  • 產生一鍵執行腳本
  • GPT持續優化使用體驗

完成批次轉檔功能後,GPT 還主動問我:「要不要加上更多進階功能?」

GPT 給了我幾個很不錯的提案:將 TXT 檔自動優化去除雜訊、自動將整本書按章節自動分段、將PDF 自動生成千字的摘要。

最重要的是,GPT 還主動問我:「要不要把程式打包成一個「點擊即執行」的檔案?」

我馬上回答:「當然好啊!」

ChatGPT AI寫程式 PDF轉TXT工具 20250318

GPT 指導我產生一個 .command 檔,讓我只要「雙擊程式」就能執行,不需要再開終端機。

echo 'python3 pdf_to_txt_batch.py' > run_pdf_converter.command
chmod +x run_pdf_converter.command

這次的自動化設計,真的讓整個流程變得非常簡單。每次要轉檔時,我只需要雙擊執行檔,就能自動完成整個轉檔流程,完全不需要再輸入指令。

AI不是萬能的

  • ChatGPT開發外掛失敗
  • 簡易部落格系統失敗
  • PDF 轉 TXT 功能成功
  • AI 無法保證每次成功
  • 成功來自持續修正嘗試

AI 並不是萬能的,尤其在寫程式這件事上,GPT 並不能保證每次都成功。

之前請 GPT 幫忙寫 WordPress 的外掛,結果不管怎麼修,信就是寄不出去;後來又試著開發一個簡易的部落格系統,最後也以失敗告終。

AI 並不是按下指令,就一定會產生完美結果的工具。但是遇到問題時,是會持續分析排查,甚至提出其他可能的解決方案。

這次的 PDF 轉 TXT 小工具,原本只是我的第三個嘗試,一開始我也沒抱太大期望。但最後完成了基本功能,還額外多了批次處理、GUI 介面、甚至是一鍵執行的自動化腳本。

GPT 並不是完美的工具,但它可以一路嘗試解決問題,AI 不一定能替你做好每一件事,但它可以陪著你,逐步修改把事情做對。

這個結論其實和人生的努力與奮鬥很像,都是慢慢修正慢慢前進,真的失敗就換一個方向,反正每個創業都只有5%的成功率,那就持續創業持續修正,大約10次之後,就會有一半的機率,大約20之後,機率就已經來到100%囉~

好啦~那今天這個小經驗分享給各位
有興趣的話你也可以
用你的 ChatGPT 試看看
讓它陪著你一起做出
你的第一個AI自動程式
先到這邊~下次見~掰

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端