如何從Python字串中刪除不可列印的字元？

首頁 > 程式設計 > 如何從Python字串中刪除不可列印的字元？

如何從Python字串中刪除不可列印的字元？

發佈於2024-11-09

How to Remove Non-Printable Characters from Strings in Python?

從Python 中的字串中剝離不可列印的字元

與Perl 相比，Python 缺乏POSIX 正規表示式類，因此很難檢測並使用正規表示式刪除不可列印的字元。

那麼，如何在 Python 中實現此目的？

一種方法是利用 unicodedata 模組。 unicodedata.category 函數將 Unicode 字元分為各種類別。例如，分類為 Cc（控制）的字元代表不可列印的字元。

利用這些知識，您可以建立符合所有控製字元的自訂字元類別：

import unicodedata
import re
import sys

all_chars = (chr(i) for i in range(sys.maxunicode))
categories = {'Cc'}
control_chars = ''.join(c for c in all_chars if unicodedata.category(c) in categories)

control_char_re = re.compile('[%s]' % re.escape(control_chars))

def remove_control_chars(s):
    return control_char_re.sub('', s)

此函數有效地從輸入字串中移除所有不可列印的 ASCII 字元。

或者，您可以使用 Python 的內建 string.printable 方法過濾掉不可列印的字元。但是，此方法不包括 Unicode 字符，因此可能不適合所有用例。

要處理Unicode 字符，您可以在正則表達式中擴展字符類，如下所示：

control_chars = ''.join(map(chr, itertools.chain(range(0x00,0x20), range(0x7f,0xa0))))

此擴充字元類別包含基本控製字元以及常見的非字元-可列印的Unicode字元。

透過對應修改remove_control_chars函數，可以成功處理ASCII和Unicode不可列印字元。

版本聲明本文轉載於：1729551315如有侵犯，請洽[email protected]刪除

最新教學更多>

$在Ubuntu/linux上安裝mysql-python時，如何修復\“ mysql_config \”錯誤？$
在Ubuntu/linux上安裝mysql-python時，如何修復\“ mysql_config \”錯誤？
mysql-python安裝錯誤：“ mysql_config找不到”“ 由於缺少MySQL開發庫而出現此錯誤。解決此問題，建議在Ubuntu上使用該分發的存儲庫。使用以下命令安裝Python-MysqldB： sudo apt-get安裝python-mysqldb sudo pip in...

程式設計發佈於2025-07-12
`console.log`顯示修改後對象值異常的原因
foo = [{id：1}，{id：2}，{id：3}，{id：4}，{id：id：5}，]，]; console.log（'foo1'，foo，foo.length）; foo.splice（2，1）; console.log('foo2', foo, foo....

程式設計發佈於2025-07-12
如何在Java字符串中有效替換多個子字符串？
在java 中有效地替換多個substring，需要在需要替換一個字符串中的多個substring的情況下，很容易求助於重複應用字符串的刺激力量。 However, this can be inefficient for large strings or when working with nu...

程式設計發佈於2025-07-12
查找當前執行JavaScript的腳本元素方法
如何引用當前執行腳本的腳本元素在某些方案中理解問題在某些方案中，開發人員可能需要將其他腳本動態加載其他腳本。但是，如果Head Element尚未完全渲染，則使用document.getElementsbytagname（'head'）[0] .appendChild（v）的常規方...

程式設計發佈於2025-07-12
反射動態實現Go接口用於RPC方法探索
在GO 使用反射來實現定義RPC式方法的界面。例如，考慮一個接口，例如：鍵入myService接口{ 登錄（用戶名，密碼字符串）（sessionId int，錯誤錯誤） helloworld（sessionid int）（hi String，錯誤錯誤） } 替代方案而不是依靠反射...

程式設計發佈於2025-07-12
Java的Map.Entry和SimpleEntry如何簡化鍵值對管理？
A Comprehensive Collection for Value Pairs: Introducing Java's Map.Entry and SimpleEntryIn Java, when defining a collection where each element com...

程式設計發佈於2025-07-12
$哪種方法更有效地用於點 - 填點檢測：射線跟踪或matplotlib \的路徑contains_points？$
哪種方法更有效地用於點 - 填點檢測：射線跟踪或matplotlib \的路徑contains_points？
在Python Matplotlib's path.contains_points FunctionMatplotlib's path.contains_points function employs a path object to represent the polygon.它...

程式設計發佈於2025-07-12
為什麼HTML無法打印頁碼及解決方案
無法在html頁面上打印頁碼？ @page規則在@Media內部和外部都無濟於事。 HTML:Customization:@page { margin: 10%; @top-center { font-family: sans-serif; font-weight: ...

程式設計發佈於2025-07-12
如何使用FormData（）處理多個文件上傳？
）處理多個文件輸入時，通常需要處理多個文件上傳時，通常是必要的。 The fd.append("fileToUpload[]", files[x]); method can be used for this purpose, allowing you to send multi...

程式設計發佈於2025-07-12
Java為何無法創建泛型數組？
通用陣列創建錯誤 arrayList [2]; JAVA報告了“通用數組創建”錯誤。為什麼不允許這樣做？答案：Create an Auxiliary Class:public static ArrayList<myObject>[] a = new ArrayList<my...

程式設計發佈於2025-07-12
C++成員函數指針正確傳遞方法
如何將成員函數置於c 的函數時，接受成員函數指針的函數時，必須同時提供對象的指針，並提供指針和指針到函數。需要具有一定簽名的功能指針。要通過成員函數，您需要同時提供對象指針（此）和成員函數指針。這可以通過修改Menubutton :: SetButton（）（如下所示：[&& && && &&華）...

程式設計發佈於2025-07-12
如何正確使用與PDO參數的查詢一樣？
在pdo 中使用類似QUERIES在PDO中的Queries時，您可能會遇到類似疑問中描述的問題：此查詢也可能不會返回結果，即使$ var1和$ var2包含有效的搜索詞。錯誤在於不正確包含％符號。通過將變量包含在$ params數組中的％符號中，您確保將％字符正確替換到查詢中。沒有此修改，PD...

程式設計發佈於2025-07-12
$解決MySQL插入Emoji時出現的\\"字符串值錯誤\\"異常$
解決MySQL插入Emoji時出現的\\"字符串值錯誤\\"異常
Resolving Incorrect String Value Exception When Inserting EmojiWhen attempting to insert a string containing emoji characters into a MySQL database us...

程式設計發佈於2025-07-12
如何使用Depimal.parse（）中的指數表示法中的數字？
在嘗試使用Decimal.parse（“ 1.2345e-02”中的指數符號表示法表示的字符串時，您可能會遇到錯誤。這是因為默認解析方法無法識別指數符號。成功解析這樣的字符串，您需要明確指定它代表浮點數。您可以使用numbersTyles.Float樣式進行此操作，如下所示：[&& && && ...

程式設計發佈於2025-07-12
$為什麼在我的Linux服務器上安裝Archive_Zip後，我找不到“ class \” class \'ziparchive \'錯誤？$
為什麼在我的Linux服務器上安裝Archive_Zip後，我找不到“ class \” class \'ziparchive \'錯誤？
Class 'ZipArchive' Not Found Error While Installing Archive_Zip on Linux ServerSymptom:When attempting to run a script that utilizes the ZipAr...

程式設計發佈於2025-07-12