python读取文件内容(python读取文件内容,删除指定内

 2021-11-17 7:51    77  

这里简单介绍一下吧python读取文件内容,读取pdf文件的话,可以使用pdfminer3k这个库,写入pdf文件的话,可以使用reportlab这个库,下面我简单介绍一下这2个库是如何读写pdf文件的,实验环境win10+python3.6+pycharm5.0,主要内容如下海之傳說媽祖

python读取文件内容(python读取文件内容,删除指定内容)

读取pdf文件这里主要用到pdfminer3k这个库,专门用来解析pdf文件,中英文都可以,下面我简单介绍一下这个库的安装和使用python读取文件内容:

python读取文件内容(python读取文件内容,删除指定内容)

1.安装pdfminer3k,这个直接在cmd窗口输入命令“pip install pdfminer3k”就行,如下python读取文件内容:

python读取文件内容(python读取文件内容,删除指定内容)

python读取文件内容(python读取文件内容,删除指定内容)

2.这里为了更好的说明问题,我新建了一个pdf文档,测试内容如下,一段中文字符串:

python读取文件内容(python读取文件内容,删除指定内容)

python读取文件内容(python读取文件内容,删除指定内容)

3.最后,就是编写相关代码来解析pdf文件了,基本思路是先创建pdf解析器,然后一页一页解析文本字符串,然后提取打印出来就行,主要代码如下:

python读取文件内容(python读取文件内容,删除指定内容)

python读取文件内容(python读取文件内容,删除指定内容)

点击运行这个程序,就能解析出pdf文件的内容,如下:

写入pdf文件这里可以使用reportlab这个库,专门用来生成最终的pdf文件(不支持中文),下面我简单介绍一下这个库的安装和使用:

1.安装reportlab,这个与上面的安装命令类似,直接在cmd窗口输入命令“pip install reportlab”就行,如下:

2.安装成功后,我们就可以写入pdf文件了,测试代码如下,很简单:

运行这个程序,就会在当前目录下生成一个pdf文件,打开后的内容如下,就是刚才程序写入的内容:

至此,我们就完成了利用python来读写pdf文件。总的来说,整个过程很简单,pdfminer3k和reportlab这2个库可以快速完成对pdf文件的读写,只要你有一定的python基础,熟悉一下相关示例和代码,很快就能掌握的,唯一不足的就是不能写入中文,pdf会出现乱码情况,当然,你也可以使用pypdf2这个库(也不支持中文)读写pdf文件,都行,网上也有相关教程,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言。

使用python进行txt文本的读取和数据处理?

1、首先打开Pycharm,新建工程。在路径中定义自己的工程名称。这样就建立了一个python工程,我们就可以利用pycharm这个编译器方便地管理python程序,从而顺利地进行我们的项目了。

python读取文件内容(python读取文件内容,删除指定内容)

2、我将工程文件存在了一个叫做pycharm的文件夹下,然后右键点击右边的文件数,新建文件,此时一定要选择python file,然后为python程序命名。这里我将程序命名为experiment.py。下一步就是在新建的.py文件中填写程序啦。

python读取文件内容(python读取文件内容,删除指定内容)

3、使用python进行txt文档的处理,首先第一步就是打开文件。但是在这之前,我们需要使用一些python的工具包来帮助我们队数据进行操作。我们可以再菜单栏中找到file-setting,然后在Project一栏中找到我们的项目所能够使用的python库,也可以在这里添加我们需要的库文件。

python读取文件内容(python读取文件内容,删除指定内容)

4、然后在文档读取时,由于这里处理的是数字,所以我们调用Numpy库进行文档信息的存储。如果需要绘图,也可以调用matplotlib。在文档读取之前,也需要定义两个空的矩阵存储数据,文档名称使用字符串存储。

python读取文件内容(python读取文件内容,删除指定内容)

5、之后我们可以使用with open语句打开文件,这种打开方式的好处在于我们之后不需要进行close操作。在文档信息读取过程中,我们使用循环语句,检测每一行的信息并存储到之前定义的矩阵中,如果读取到空的数据,那就结束文档的读取。

python读取文件内容(python读取文件内容,删除指定内容)

6、最后,我们就已经得到了文档中所有的数据。可以使用print命令打印相应的信息,也可以进一步处理,比如数据的复制,数据顺序的打乱等。python读取文档数据并转化为numpy矩阵是信息和数据处理的基础,在此基础上我们可以使用python进行更多的工作,利用好python这一工具,我们的学习生活会轻松很多。

python读取文件内容(python读取文件内容,删除指定内容)

本文标签:读取文本

原文链接:https://www.xgfox.com/bcrm/34139.html

本文版权:如无特别标注,本站文章均为原创。