![]() |
【求助】如何用VBA或其他(例如Python)获取文本中特定字符?
1 个附件
要获取的字符是以“https://v.qq.com/x/page/”,开始的网址
例如:“https://v.qq.com/x/page/n08227d6av4.html” 有个问题,每个这样的网址在文本里会出现两次,但结果只要一个,每个网址一行,不要引号。 |
用正则匹配一下,应该可以吧。
|
正则。。。。
<strong.*?href="(https://v.qq.com/x/page/.*?.html)" 取获取的值的group[1] |
代码丑一点,凑合先用一下吧. 已去重复的URL
python 代码:
import re |
2 个附件
引用:
Python 3.7.1 IDLE打开code.py,没反应啊。 |
引用:
|
引用:
File "F:\code.py", line 6, in <module> for line in f: UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence |
1 个附件
引用:
代码:
package main |
引用:
可能1是头部我没有加。 2有可能是文件编码问题。 先加上头部 # -*- coding: utf-8 -*-试试。 不行,就 加上 encoding='gbk' 即那一行换成 with open(txt,encoding='gbk') as f: 代码:
# -*- coding: utf-8 -*- |
所有时间均为北京时间, 现在的时间是 18:58:42. |
Copyright © 2000 - 2019 ClassiClub Forum All Rights Reserved.