精品技术论坛

精品技术论坛 (https://bbs.et8.net/bbs/index.php)
-   『软件使用』 (https://bbs.et8.net/bbs/forumdisplay.php?f=17)
-   -   【求助】如何用正则替换随机字符串+网站名称 (https://bbs.et8.net/bbs/showthread.php?t=1003547)

云裴 2010-09-02 14:26:21

【求助】如何用正则替换随机字符串+网站名称
 
在一个网站下载的txt文件,带有很多的多余字符,由一串随机字符串+网站名称+和前面一样的随机字符串组成。怎么在ultraedit中用正则命令替换掉?

HTML 代码:

pdTZ48pvEfgrkQ精校阅读网www.jjydw.cn精校,带给您超爽阅读体验!pdTZ48pvEfgrkQ非但如此,贺一鸣还发现了,虽然是同样的水系力量,但是也有着不同的频率。这种神秘的频率可以通过修炼的速度和功法进行微调。而经过了微调之后,周围的水系天地之力愈发地与袁礼薰身上的气息相融了。

  vkNsmQygJ4UTByxF精校阅读网www.jjydw.cn精校,带给您超爽阅读体验!vkNsmQygJ4UTByxF特别是她修炼之时,竟然隐隐地产生了一种天人合一的感觉。


下一步 2010-09-02 14:43:13

我在 www.uutxt.com 下载的小说也有这个问题,看看用什么简单的办法删除掉。

在每章的开始处有不同的水印,有点恶心。
如:

uu書萌 UUTxT.COM 全汶吇板阅渎

UU书盟 Uutxt。com 全文吇版越读

优悠書擝 uuTXT。CoM 铨蚊吇坂越牍

MacOS 2010-09-02 14:50:38

砍掉多于一个的ASCII?
[\x01-\xff]{2,}
但这个假如碰见有英文单词就会同样被砍掉,在EMEDITOR下实现

MacOS 2010-09-02 14:55:05

引用:

作者: 下一步 (文章 10652951)
我在 www.uutxt.com 下载的小说也有这个问题,看看用什么简单的办法删除掉。

在每章的开始处有不同的水印,有点恶心。
如:

uu書萌 UUTxT.COM 全汶吇板阅渎

UU书盟 Uutxt。com 全文吇版越读

优悠書擝 uuTXT。CoM 铨蚊吇坂越牍

这种写法太恶心了没法总结出有效的规则,要么用前后文判断

enigma 2010-09-02 15:15:53

1楼的同学试试
(\w{10,20}).{0,200}\1
替换为空

2楼的同学试试这个
(u|U|u|U|悠|優|幽|憂|优|滺)(u|U|u|U|悠|優|幽|憂|优|滺)(书|書)(盟|擝|萌)\s(u|U|u|U)(u|U|u|U)(t|T|t|T)(x|X|x|X)(t|T|t|T)(\.|.|。)(c|C|c|C)(o|O|o|O)(m|M|m|M)\s(铨|诠|荃|全)(纹|文|汶|蚊)(子|自|吇|字)(板|版|扳|坂)(月|粤|阅|越)(镀|读|渎|牍)
替换为空

云裴 2010-09-02 15:21:09

引用:

作者: MacOS (文章 10652953)
砍掉多于一个的ASCII?
[\x01-\xff]{2,}
但这个假如碰见有英文单词就会同样被砍掉,在EMEDITOR下实现

谢谢。按你说的,如下面这样可替换前面的,后面还有一个字符串需要替换。有没有什么正则可以表示前面出现过的字符串呢

[\x01-\xff]{2,}精校阅读网www.jjydw.cn精校,带给您超爽阅读体验!

云裴 2010-09-02 15:24:02

引用:

作者: enigma (文章 10652972)
1楼的同学试试(\w{10,20}).{0,200}\1替换为空

谢谢。学习了\1这个用法,呵呵。我用下面的方法成功了。

代码:

([\x01-\xff]{2,})精校阅读网www.jjydw.cn精校,带给您超爽阅读体验!\1

下一步 2010-09-02 15:40:59

引用:

作者: enigma (文章 10652972)
1楼的同学试试(\w{10,20}).{0,200}\1替换为空2楼的同学试试这个(u|U|u|U|悠|優|幽|憂|优|滺)(u|U|u|U|悠|優|幽|憂|优|滺)(书|書)(盟|擝|萌)\s(u|U|u|U)(u|U|u|U)(t|T|t|T)(x|X|x|X)(t|T|t|T)(\.|.|。)(c|C|c|C)(......

这个不行了,如果只是上面三段是可以。但因为还有不同的字了.....

enigma 2010-09-02 16:55:38

引用:

作者: 下一步 (文章 10652986)
这个不行了,如果只是上面三段是可以。但因为还有不同的字了.....

您没仔细看,也没试吧?

wgf4242 2010-09-02 17:30:45

还是从源码过滤好.

lyg021 2010-09-02 21:19:32

搭车问一下:
用正则如何删除任意2个符号+符号中间的所有字符,例如(gvjhgkjhlkjnklgfnmkdfsigj)或者@中间的所中间的所@

wgf4242 2010-09-02 21:24:23

引用:

作者: lyg021 (文章 10653155)
搭车问一下:
用正则如何删除任意2个符号+符号中间的所有字符,例如(gvjhgkjhlkjnklgfnmkdfsigj)或者@中间的所中间的所@

\(.*\)
@.*@

下一步 2010-09-04 13:55:23

引用:

作者: enigma (文章 10652972)
1楼的同学试试(\w{10,20}).{0,200}\1替换为空2楼的同学试试这个(u|U|u|U|悠|優|幽|憂|优|滺)(u|U|u|U|悠|優|幽|憂|优|滺)(书|書)(盟|擝|萌)\s(u|U|u|U)(u|U|u|U)(t|T|t|T)(x|X|x|X)(t|T|t|T)(\.|.|。)(c|C|c|C)(......

在UltraEdit里搜索不到东西。

river01 2010-09-05 16:41:53


这样的小说站很恶心,我通常宁可舍弃这样的小说
推荐个比较纯净的站:http://www.abada.cn/

enigma 2010-09-06 10:41:08

引用:

作者: 下一步 (文章 10654251)
在UltraEdit里搜索不到东西。

打开正则表达式搜索了吗?perl规则。
我专门去uutxt.com下了几个小说测试无误的。


所有时间均为北京时间, 现在的时间是 08:52:22.

本论坛带宽由迅通网络提供
SSL证书由TrustAsia提供

Copyright © 2000 - 2019 ClassiClub Forum All Rights Reserved.
粤ICP备09123456号