最近在ubuntu linux下混,可惜CppBlog下的FreeTextBox用firefox一打开就假死,而TextBox又不支持文本转html(主要是没有加换行),于是就写了一个脚本.
在/usr/bin中新建一个快捷方式,名为txt2htm,然后在属性中设为可执行,就可以用了 用法如
txt2htm xxx.txt
为了方便起见,大家可以新建一个后缀为txt的文件,点右键,选打开方式,输入命令txt2htm,然后确定,以后只要点点鼠标选"以...打开"就可以完成工作了.
windows下当然也可以使用这个脚本,添加到右键的方法是按着shift点右键,选打开方式.
--------------------------------------------------------------
#!/usr/local/bin/python
# -*-coding:UTF-8-*-
#txt2htm.py
#Author: 张沈鹏 zsp007@gmail.com
#Update: 2006-11-10 Beta0.2
import sys
import re
def htmlWrapper(content,tag,attr):
return "<"+tag+" "+attr+">"+content+""
def fontColorWrapper(content,color):
return htmlWrapper(content,'font','color="#'+color+'"')
def htmHighLight(line):
keywords=["if","then","else","def","for","in","return","import","print","unsigned","long","int",\
"short","include","class","void","while","const","template"
]
for i in keywords:
keywordMatcher=re.compile(r'\b'+i+r'\b')
line = keywordMatcher.sub(fontColorWrapper(i,'cf0000'), line)
return line
def txt2htm(txtName):
txt=open(txtName)
htmlName=filename+".html"
htm=open(htmlName,"w")
for line in txt:
line=line\
.replace('&','&')\
.replace('<','<')\
.replace('® ','® ')\
.replace('"','"')\
.replace('©','©')\
.replace('™','™')\
.replace('<','<')\
.replace('\t'," ").\
replace(' ',' ')
line="
"+htmHighLight(line)
print line
htm.write( line)
txt.close()
htm.close()
print "\n转换成功,保存在"+htmlName+'\n'
if len(sys.argv) < 2:
print "\n请指定要转换为htm的文件\n"
else:
filename=sys.argv[1]
txt2htm(filename)
分享到:
相关推荐
于是安装了一下,安装过程很简单: sudo pip install pdfminer; 中间也没有任何的报错。至于如何调用,本人也没有很好的研究过pdfminer这个库,于是开始了百度…… 官方文档:http://www.unixuser.org/~euske/...
这个Python脚本是一个简单的网页爬虫,它可以爬取指定URL的页面内容,并将爬取的内容打印出来。爬虫基于requests库来获取网页内容,并使用BeautifulSoup库来解析HTML内容。通过此脚本,你可以轻松地获取网页上的文本...
使用python进行多内容的两个txt的数据比对 使用简单,保存脚本,将需要比对的txt地址修改好,执行脚本 生成html打开查看比对结果 内附有说明书
请注意,这只是一个简单的示例,用于演示如何使用Python进行基本的网页爬取。在实际应用中,你可能需要处理更复杂的HTML结构、处理异常情况、设置请求头、使用代理等。此外,请务必遵守网站的robots.txt文件和相关...
适用于Python脚本执行的Python Flask网站 使用python中的Flask库,单击按钮即可创建网站并执行脚本。 如果您要使用python进行网站创建并在使用http链接的按钮单击上执行python代码,请使用此选项。 使用Flask使其...
SSL检查器从主机收集SSL / TLS信息的Python脚本关于这是一个运行在python中的简单脚本,用于收集SSL / TLS信息,然后以JSON返回信息组。 它还可以通过您指定的SOCKS服务器进行连接。 此脚本的优点之一是,它将完全...
遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施...
此文档是python学习的入门文档,文件格式txt可以修改格式为html,方便阅读。 第 1 章 安装 Python 第 2 章 第一个 Python 程序 第 3 章 内置数据类型 第 4 章 自省的威力 第 5 章 对象和面向对象 第 6 章 异常和文件...
遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施...
gif2txt 是一个 Python 脚本,可以将一个 Gif 动画图像转成用 ASCII 字符表示的动画效果。静态图像版本请看 img2txt依赖:Jinja2PIL转换后的效果请看:http://hit9.github.io/gif2txt/out.html 标签:gif2...
这个档案是python套件,可将BIO标记档案(txt格式)转换成xml档案。 输出文件将上传到Markus网站( ),以供专家进行进一步调查。 步骤1: 带标签的txt文件应保存在名为“ bio_input”的文档文件夹中。 Xml文件...
出于个人目的制作的Python脚本 文件管理: 具有用于文件管理的有用功能的自制模块,还可以用作个人笔记本来记住我最常用的操作系统和关机功能。 OrdenarArchivos: 蠕动以基于文件的类型和用户选择的预定义类别对...
项目概述:高效且开源的Python Django ERP系统,其源码涵盖全面的业务管理功能。该项目主要由Python语言编写,同时融合了HTML, JavaScript和CSS技术。 技术构成: - Python源文件:74个 - 电子表格文件:18个.xls -...
有助于查找字幕的python脚本集合可更改目录名称 设置非常简单 1.首先使用git clone https://github.com/nickk2002/Movies-Script-Helper 2.导航到已创建的文件夹cd Movies-Script-Helper 3,安装要求pip install -...
从您的 ITPROTV 帐户下载视频以供离线观看的 Python 脚本 要求 Python 3.6 及以上 BeautifulSoup - 请求 - html5lib - Selenium - tqdm - ChromeDriver - 获取 cookies.txt - itpro.tv 上的活跃订阅 用法 ...
- Python脚本(.py):74个 - 电子表格(.xls):18个 - 网页模板(.html):15个 - 文档(.doc):8个 - JavaScript脚本(.js):3个 - 逗号分隔值文件(.csv):3个 - 图像文件(.gif):2个 - Word文档(.docx)...
技术构成包括主要的Python脚本,搭配JavaScript、CSS和HTML进行前端展示。 技术细节: - 文件总数:966个 - Python脚本:424个,负责数据处理和后端逻辑 - 图片资源:258个PNG和20个JPG,用于视觉展示和图标设计 ...
其中getHtml.py是已经写好的Python脚本,html.txt是目标文件,也就是要把脚本运行结果输出到html.txt中 打开html.txt文件,可以看到里面已经有内容了: 以上这篇Python3.6笔记之将程序运行结果输出到文件的方法就是...
一个Python脚本,可将电影分级自动插入到IMDB配置文件中。 目录: 用法: https://github.com/Montanaz0r/IMDB-ratings-auto-inserter.git pip install -r requirements.txt python main.py 要求: 我在执行此...
文件类型包括编译后的字节码文件(pyc: 45),原始Python脚本(py: 41),日志文件(log: 22),Markdown文档(md: 4),文本文件(txt: 2),系统隐藏文件(DS_Store: 1),JSON配置文件(json: 1),HTML页面...