🦒 Python_スクレイピング_はてぶ2
作成日: 2022/07/01
0

■本
スクレイピング・ハッキング・ラボ Pythonで自動化する未来型生活 (技術の泉シリーズ(NextPublishing))

ゴール

はてなブックマークトップ記事のブックマーク詳細ページまでスクレイピングして、ブックマークユーザーのコメントを取得

コード

※コメントでない

import requests
from bs4 import BeautifulSoup

url = "https://b.hatena.ne.jp/"

response = requests.get(url)

soup = BeautifulSoup(response.content,"html.parser")
top_entry = soup.find("section", attrs = {"class":"entrylist-unit"})
entries = top_entry.find_all("div", attrs = {"class": "entrylist-contents"})

for entry in entries:
  title_tag = entry.find("h3", attrs={"class": "entrylist-contents-title"})
  title = title_tag.find("a").get("title")
  print("h3タイトル: " + title)

bookmark_tag = entry.find("span", attrs = {"class": "entrylist-contents-users"})
bookmark_link = bookmark_tag.find("a").get("href")
bookmark_url = url + bookmark_link

response = requests.get(bookmark_url)
soup = BeautifulSoup(response.content, "html.parser")
comments = soup.find_all("span", attrs = {"class": "entry-comment-text"})

for comment in comments:
  print(comment.get_text())

スクリーンショット 2022-07-01 12.59.40.png

39%まで