將Unicode文本寫入文本文件?我從Google文檔中提取數(shù)據(jù),處理數(shù)據(jù),并將其寫入文件(最終我將粘貼到Wordpress頁面)。它有一些非ASCII符號。如何安全地將這些轉換為可以在HTML源代碼中使用的符號?目前,我正在將所有內容轉換為Unicode,并將其連接到Python字符串中,然后執(zhí)行以下操作:import codecs
f = codecs.open('out.txt', mode="w", encoding="iso-8859-1")f.write(all_html.encode("iso-8859-1", "replace"))最后一行存在編碼錯誤:UnicodeDecodeError:‘ASCII’編解碼器無法解碼12286位置的字節(jié)0xa0:序數(shù)不在范圍內(128個)部分解決辦法:此Python運行時沒有錯誤:row = [unicode(x.strip()) if x is not None else u'' for x in row]all_html = row[0] + "<br/>" + row[1]f = open('out.txt', 'w')f.
write(all_html.encode("utf-8"))但是如果我打開實際的文本文件,我會看到很多符號,比如:Qur???an也許我需要寫點別的東西而不是文本文件?
3 回答

萬千封印
TA貢獻1891條經驗 獲得超3個贊
CHAR已存儲在內存中的Unicode(32位)中。 您只需在utf-8中打開文件即可。 (32位Unicode到utf-8的轉換將自動從內存執(zhí)行到文件。) out1 = "(嘉南大圳 ㄐㄧㄚ ㄋㄢˊ ㄉㄚˋ ㄗㄨㄣˋ )"fobj = open("t1.txt", "w", encoding="utf-8")fobj.write(out1)fobj.close()
添加回答
舉報
0/150
提交
取消