大橙子网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
首先一些Python字符串处理的简易常用的用法。其他的以后用到再补充。
成都创新互联是一家专业提供灵石企业网站建设,专注与网站制作、成都做网站、H5技术、小程序制作等业务。10年已为灵石众多企业、政府机构等服务。创新互联专业网站制作公司优惠进行中。
s = "hello hello hello"
s = ' '.join(s.split())
s = "hello\nhello\nhello hello\n"
print(s)
s = s.replace("\n","")
print(s)
s = "hello\nhello\nhello hello\n"
print(s.find('\n'))
print(s.find('la'))
s = "hello\nhello\nhello hello\n"
print(s.rfind('\n'))
print(s.rfind('la'))
s = "hello\nhello\nhello hello\n"
print(list(s))
import re
s = "hello\nhello\nhello hello\n"
print(re.findall('hello',s)) # hello也可以换成正则表达式
import requests
r = requests.get('https://baike.baidu.com')
with open('test.html', 'wb') as fd:
for chunk in r.iter_content(100):
fd.write(chunk)
# encoding : utf-8
with open('test.html','r',encoding='utf-8') as f:
content = f.readlines()
content = ''.join(content)
# content = content.replace('\n','') # 如果想去掉回车可以加上这行
print(content)
from bs4 import BeautifulSoup
soup = BeautifulSoup(content,'html.parser')
print(soup.prettify())
'''
学习中遇到问题没人解答?小编创建了一个Python学习交流群:
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
soup = BeautifulSoup(content,'html.parser')
print(soup.find_all('a'))
或者提取出所有标签和标签
soup = BeautifulSoup(content,'html.parser')
print(soup.find_all(['a','b']))
这些属于beautifulsoup的内容了
import re
re.split('; |, ',str)
>>> a='Beautiful, is; better*than\nugly'
>>> import re
>>> re.split('; |, |\*|\n',a)
['Beautiful', 'is', 'better', 'than', 'ugly']