亚洲日本欧洲欧美视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

requests_html

https://requests.readthedocs.io/projects/requests-html/en/latest/

非常好的教程：https://www.jcchouinard.com/web-scraping-with-python-and-requests-html/#Extract_the_Title_From_the_Page

from requests_html import HTML, HtmlElement, HTMLResponse, HTMLSession
def article_parse():
    session = HTMLSession()
    #新聞首頁(list頁面）
    r = session.get('https://www.ctdf.org.cn/article/category/news-2')

    '''
    node = r.html.find('#about', first=True'，containing=None )  #查第一個element，否則返回list,設定contain則只會返回包含指定文本的Element對象
    node_text = node.text   #獲取文本
    node_links = node.absolute_links   #內部所有的絕對Link
    node_attrs = node.attrs  #獲取所有屬性
    ode_html = node.html  #獲取其html
    node.find('a')        #獲取其內部的特定子Element對象，返回List
    node.html.search('something{}xxx')[0]  # 所有匹配可以設定開頭和結尾中間的大括號里的內容,就是要取出來的 
    

    '''

    find里面用的css選擇器例子：
        a
        a.someClass
        a#someID
        a[target=_blank]

posted @ 2023-09-12 14:30 花生與酒閱讀(33) 評論(0) 收藏舉報

刷新頁面返回頂部

花生與濁酒

主要是工作和學習備忘筆記，大部分是實驗記錄＋加工整理，少量復制粘貼博友的資料（請諒解）

requests_html

公告