”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何在删除 Python 文本文件中的非 ASCII 字符时保留空格和句点?

如何在删除 Python 文本文件中的非 ASCII 字符时保留空格和句点?

发布于2024-11-08
浏览:990

How to Preserve Spaces and Periods While Removing Non-ASCII Characters in Python Text Files?

处理非 ASCII 字符,保留空格和句点

处理文本文件时,通常需要删除非 ASCII 字符,而保留特定的实体,例如空间和句点。提供的 Python 代码成功过滤掉了非 ASCII 字符,但无意中也去除了空格和句点。

要解决此问题,我们需要修改 onlyascii() 函数以从过滤过程中显式排除空格和句点。这是更新版本:

def onlyascii(char):
    if char == ' ' or char == '.':
        return char
    elif ord(char)  127:
        return ''
    else:
        return char

在这个修改后的 onlyascii() 函数中,我们检查字符是否是空格(' ')或句点('.'),如果是则返回。此修改确保这些实体保留在过滤后的字符串中。

要利用更新后的 onlyascii() 函数,我们可以修改 get_my_string() 函数以使用此函数过滤字符:

def get_my_string(file_path):
    f = open(file_path, 'r')
    data = f.read()
    f.close()
    filtered_data = filter(onlyascii, data)
    filtered_data = filtered_data.lower()
    return ''.join(filtered_data)

join() 方法用于连接 filter() 函数返回的可迭代对象中的字符,生成一个字符串。

通过实现这些修改后,您可以删除非 ASCII 字符,同时保留文本字符串中的空格和句点,以满足您的特定项目要求。

版本声明 本文转载于:1729340957如有侵犯,请联系[email protected]删除
最新教程 更多>
  • JavaScript DOM 与 BOM!
    JavaScript DOM 与 BOM!
    DOM DOM 代表文档对象模型,代表网页。这允许程序操纵文档结构、样式和内容。 const listDiv = document.getElementById("list-div"); listDiv.classList.add('new-class'); listDiv.cla...
    编程 发布于2024-11-08
  • 绑定和模板:Peasy-UI 系列的一部分
    绑定和模板:Peasy-UI 系列的一部分
    Table of Contents Introduction Bindings and the Template Text Bindings Basic Binding Conditional Boolean Text B...
    编程 发布于2024-11-08
  • 实现接口
    实现接口
    定义接口后,一个或多个类可以实现它。 要实现接口,请在类定义中使用 Implements 子句。 该类必须实现接口所需的所有方法。 包含 Implements 子句的类的一般形式是: 类类名扩展超类实现接口{ // 类体 } 若要实现多个接口,接口之间用逗号分隔。 实现接口时,extend...
    编程 发布于2024-11-08
  • 检查 Effect-TS 选项中的元素:实用指南
    检查 Effect-TS 选项中的元素:实用指南
    Effect-TS 提供了检查 Option 是否包含特定值的方法。这些函数允许您使用自定义等价函数或默认等价来确定选项中是否存在值。在本文中,我们将探讨用于检查选项中元素的两个关键函数:O.containsWith 和 O.contains. 示例 1:使用 O.containsW...
    编程 发布于2024-11-08
  • Python 面向对象编程简介
    Python 面向对象编程简介
    Python 编程语言 Python 是一种解释型、面向对象的编程语言。由于其高级内置数据结构和动态类型,它在快速开发新应用程序以及编写脚本代码以组合用不同语言编写的现有组件方面很受欢迎。 Python简单易学的语法强调可读性,从而降低了长期程序维护的成本和复杂性。它支持各种包含代...
    编程 发布于2024-11-08
  • 最佳软件比较中的顶级数据科学工具
    最佳软件比较中的顶级数据科学工具
    介绍 到 2024 年,数据科学将通过使用复杂的分析、人工智能和机器学习推动决策,继续改变业务。随着对熟练数据科学家的需求不断增加,对能够加快操作、提高生产力并提供可靠见解的强大工具的需求也在增加。但是,有这么多可用的选项,目前哪种软件最适合专业人士? 这项比较研究探讨了 2024...
    编程 发布于2024-11-08
  • 我如何将应用程序性能提高到
    我如何将应用程序性能提高到
    ⌛ 回顾时间 在我的上一篇博客中,我谈到了如何在短短 2 周内将应用程序大小从 75MB 减少到 34MB(查看!)。但这还不是全部,我还将我们应用程序的整体性能提高了 80%?. 让我们来看看如何!! ?传说 经过简单的一轮浏览后,我发现我们的应用程序中存在一些导...
    编程 发布于2024-11-08
  • Django 查询集可以通过模型属性过滤吗?
    Django 查询集可以通过模型属性过滤吗?
    按模型属性过滤 Django 查询集Django 模型上的查询通常使用标准过滤器根据预定义字段值选择特定实例。但是,如果您需要根据模型中定义的自定义属性进行过滤,该怎么办?您可以通过模型属性过滤查询集吗?不幸的是,Django 的过滤器主要运行在数据库级别,将它们转换为 SQL 命令以有效地检索数据...
    编程 发布于2024-11-08
  • 尽管配置正确,为什么我无法在 Laravel 中发送 TLS 电子邮件?
    尽管配置正确,为什么我无法在 Laravel 中发送 TLS 电子邮件?
    无法发送 TLS 电子邮件:解决 Laravel 证书验证错误尽管启用了不太安全的 Gmail 设置并正确配置了 Laravel 的 .env 文件,您在发送 TLS 电子邮件时遇到证书验证失败。错误消息表明 SSL 操作失败并且无法验证服务器证书。要解决此问题,如果您的操作系统没有自动管理受信任的...
    编程 发布于2024-11-08
  • 使用 Wasmtime 和 Wasm3 将 Golang 编译为 Wasm 时出现错误如何解决?
    使用 Wasmtime 和 Wasm3 将 Golang 编译为 Wasm 时出现错误如何解决?
    使用 Wasmtime 和 Wasm3 将 Golang 编译为 Wasm 时出现错误使用 GOOS=js 将 Golang 代码编译为 WebAssembly (Wasm) GOARCH=wasm go使用 Wasmtime 或 Wasm3 执行时,build -o main.wasm 可能会导致...
    编程 发布于2024-11-08
  • 如何访问 Iframe 的当前位置?
    如何访问 Iframe 的当前位置?
    访问 iframe 的当前位置:挑战和解决方法跨源资源共享 (CORS) 法规在尝试检索 iframe 时带来了重大挑战iframe 的当前位置。此安全措施可防止驻留在不同来源的 JavaScript 代码直接访问页面的 URL。虽然使用 JavaScript 访问 iframe 的 URL 不可行...
    编程 发布于2024-11-08
  • Spring Security 与 JWT
    Spring Security 与 JWT
    In this article, we will explore how to integrate Spring Security with JWT to build a solid security layer for your application. We will go through ea...
    编程 发布于2024-11-08
  • Google Sheets:如何花费数小时构建 SUMIFS
    Google Sheets:如何花费数小时构建 SUMIFS
    大家好!今天我想分享一个我创建的超级有用的脚本,用于解决日常生活中的常见问题。 如果您曾经尝试在 Google 表格中对“持续时间”求和,您可能已经注意到,SUMIF 和 SUMIFS 公式无法根据特定条件对事件或产品的持续时间求和。根据您需要执行的计算类型,这可能会成为一个障碍。但别担心! Goo...
    编程 发布于2024-11-08
  • WordPress 迁移插件终极指南
    WordPress 迁移插件终极指南
    迁移 WordPress 网站就像收拾房子搬到新房子一样。确保所有内容(内容、主题、插件、媒体文件甚至数据库)完美移动且没有任何损坏的挑战似乎令人望而生畏。但就像搬家公司让搬家变得更容易一样,WordPress 迁移插件简化了将网站从一台主机移动到另一台主机的复杂过程。 无论您是切换主机、从本地开发...
    编程 发布于2024-11-08
  • 如何使用稳健的解决方案增强 PHP 中的 HTML 抓取
    如何使用稳健的解决方案增强 PHP 中的 HTML 抓取
    PHP 中强大的 HTML 抓取解决方案由于其挑剔和脆弱的性质,在 PHP 中使用正则表达式进行 HTML 抓取可能具有挑战性。要获得更强大、更可靠的方法,请考虑使用专门构建的 PHP 包。强烈推荐的一个选项是 PHP Simple HTML DOM Parser。该库擅长处理 HTML(包括无效标...
    编程 发布于2024-11-08

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3