BeautifulSoup中的get_text( )函数如何只获取当前标签的值,而不获取子标签的值?
关注者
7被浏览
22,762登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏
...: soup = BeautifulSoup(html, "lxml")
...:
In [54]: a, b = soup.find('li').stripped_strings
In [55]: a
Out[55]: 'Hello'
In [56]: b
Out[56]: 'World'
li 标签有两个文本节点, get_text是把所有的文本节点都拼接起来返回, 我们可以使用 `.strings`单独获取每个文本节点, 然后使用`.stripped_strings` 把前后的空格去掉.
刚刚在Stack Overflow回答了一模一样的问题:
Python beautiful soup removing extra text
属于不太常见常见提问之一.