在 Python 中處理簡繁轉化,最推薦的工具是 OpenCC。它的準化率很高,也是目前開源社群的主流選擇。
安裝 OpenCC
你需要先安裝 opencc-python-reimplemented 這個庫。它是 OpenCC 的 Python 重新實現版,安裝非常簡單。
Bash
pip install opencc-python-reimplemented
轉換程式碼
這段程式碼會展示如何將簡體字轉為繁體字。
Python
from opencc import OpenCC
# 初始化轉換器,s2t 代表 Simplified Chinese to Traditional Chinese
cc = OpenCC('s2t')
simple_text = "人工智能改变了世界"
traditional_text = cc.convert(simple_text)
print(traditional_text)
常用轉換模式
OpenCC 支援多種轉換模式,你可以根據需求更改初始化時的參數。
- s2t:簡體到繁體。
- t2s:繁體到簡體。
- s2tw:簡體到台灣正體。
- s2twp:簡體到台灣正體,並轉換慣用語(例如:軟件變軟體)。
這類工具通常只是查表替換,處理單字很快。但如果你需要處理專業術語的對應,建議使用帶有 p 結尾的模式,這樣讀起來會更自然。