文章详情页
ruby - nokogiri 怎么获取一个 html 元素自身的 text 文本但不包含起子元素的 text 文本?
浏览:159日期:2023-10-15 14:19:56
问题描述
<body> <p id=’p1’>111</p> <p id=’p2’>222<p id=’p3’>333 <p id=’p4’>444</p></p><p id=’p33’>bbb</p> </p></body>
比如:p2元素自身的text为222.但使用nokogiri获取p2的text文本时,会包含p2的各级子元素的文本,比如p3和p4的text文本也包含在内。而我只想要p2自身的text文本,即只要222。
require ’nokogiri’html = Nokogiri::HTML(open ’test.html’)p2_obj = html.xpath('//*[@id=’p2’]')p2_text = p2_obj.to_s #这样会获取到p2各级子元素的文本
那么怎么样才能只获取到p2自身的text文本(即只要222,不要333 444 bbb)呢?
问题解答
回答1:p2_obj.children[0].text就是p_obj自身的text文本,也就是222,不包含333 444 bbb
标签:
HTML
相关文章:
1. python - scrapy url去重2. python爬虫 - scrapy使用redis的时候,redis需要进行一些设置吗?3. python - TypeError: tryMsgcode() takes exactly 2 arguments (0 given)4. sass - gem install compass 使用淘宝 Ruby 安装失败,出现 4045. python callable的理解6. android - 如何实现QQ pad 点击右侧输入框,只顶右侧的布局,左侧布局不动7. mysql - python如何给微信小程序写后台?8. mysql数据库每次查询是一条线程吗?9. Python pyinstaller 打包后在其他电脑运行失败10. 看不懂你这一步的操作
排行榜

网公网安备