删除空格和线条对我不起作用

问题描述 投票:0回答:1

我无法从 Web 数据中删除制表符空格,我想将其输入到 Excel 工作表中。

import requests as r
from bs4 import BeautifulSoup


url='https://www.screener.in/screens/41109/all-stocks/?limit=100&page=1'

response = r.get(url)

soup=BeautifulSoup(response.text, 'html.parser')
table=soup.find_all('table')
table_len=soup.find_all(len('table'))

scrnr_table=soup.find_all('th')
header_tags=[header.text.strip('\n') for header in scrnr_table]
data_rows = soup.find_all('tr')
row_values = [dr.text.strip() for dr in data_rows]


for header in header_tags:
        h_values=header.strip('\n')
        print(header)

答案:

  S.No.
Name
                    CMP
                    Rs.
                    P/E
                    
                    Mar Cap
                    Rs.Cr.
                    Div Yld
                    %
                    NP Qtr
                    Rs.Cr.
                    Qtr Profit Var
                    %
                    Sales Qtr
                    Rs.Cr.
                    Qtr Sales Var
                    %
                    ROCE
                    %
S.No.
Name
                    CMP
                    Rs.
                    P/E
                    
                    Mar Cap
                    Rs.Cr.
                    Div Yld
                    %
                    NP Qtr
                    Rs.Cr.
                    Qtr Profit Var
                    %
                    Sales Qtr
                    Rs.Cr.
                    Qtr Sales Var
                    %
                    ROCE
                    %

正在填充的空间似乎不受

str.strip('\n')
str.strip('\t')
方法的影响。

请帮我解决这个问题。

python html beautifulsoup openpyxl strip
1个回答
0
投票

使用

get_text
方法控制分隔符和条带标志的符号。

header_tags = [header.get_text('\n', strip=True) for header in scrnr_table]

这里是输出的前几个结果

S.No.
Name
CMP
Rs.
P/E
#[...]
© www.soinside.com 2019 - 2024. All rights reserved.