python特定段落的文本匹配
问题描述
a=’’’[Scene: Central Perk, Chandler, Joey, Phoebe, and Monica are there.]Monica: There’s nothing to tell! He’s just some guy I work with!Joey: C’mon, you’re going out with the guy! There’s gotta be something wrong with him!Chandler: All right Joey, be nice.? So does he have a hump? A hump and a hairpiece?Phoebe: Wait, does he eat chalk?[Scene: Chandler, Joey,abcsde.]Phoebe: Just, ’cause, I don’t want her to go through what I went through with Carl- oh!Monica: Okay, everybody relax. This is not even a date. It’s just two people going out to dinner and- not having sex.Chandler: Sounds like a date to me.[Scene: Joey.]’’’
我有一段文本a,如上,我想取得每个场景的对话文本,保存成lsit,每个场景的区分是[Scene: 加一句英文.],如上面加粗的部分然后用正则表达式写,paragraphs = re.findall(’[Scene: w+.](.*?)[Scene: w+.]’,a,re.S)
我发现没有匹配出内容来,paragraphs是个空的,请问错误的原因在哪,该如何去匹配每一场景的对话内容?谢谢。
问题解答
回答1:错误有几点没有使用原生字符串没有转义[
以下是我修改后的代码。
paragraphs = re.findall(r'[Scene: [ws,]+.]s([^[]+)s(?=[Scene: [ws,]+.])', a, re.S)
python正则表达式指南http://www.cnblogs.com/huxi/a...
相关文章:
1. Python爬虫如何爬取span和span中间的内容并分别存入字典里?2. mysql - 把一个表中的数据count更新到另一个表里?3. 请教使用PDO连接MSSQL数据库插入是乱码问题?4. mysql - 分库分表、分区、读写分离 这些都是用在什么场景下 ,会带来哪些效率或者其他方面的好处5. visual-studio - Python OpenCV: 奇怪的自动补全问题6. 视频文件不能播放,怎么办?7. mysql 查询身份证号字段值有效的数据8. linux - Ubuntu下编译Vim8(+python)无数次编译失败9. node.js - nodejs开发中常用的连接mysql的库10. python - 爬虫模拟登录后,爬取csdn后台文章列表遇到的问题
