Playwright実践ガイド — Webスクレイピングからブラウザ自動化まで
約8分で読めます
Playwright実践ガイド
PlaywrightはMicrosoftが開発したブラウザ自動化ライブラリ。Selenium時代の課題を解決し、モダンなWebアプリケーションの自動操作に最適だ。
なぜPlaywrightか
- 自動待機: 要素の表示を自動で待つ。明示的なsleepが不要
- 複数ブラウザ対応: Chromium、Firefox、WebKit
- ヘッドレス/ヘッドフル: headless=Trueでサーバー環境でも動作
- セッション永続化: storageStateでCookie/localStorageを保存・復元
セッション永続化(最重要テクニック)
# セッション保存
state = await context.storage_state()
Path("session.json").write_text(json.dumps(state))
# セッション復元
context = await browser.new_context(storage_state="session.json")
毎回ログインする必要がなくなり、レート制限やCAPTCHAのリスクも低減。
実践: スクレイピング+スクリーンショット
async with async_playwright() as pw:
browser = await pw.chromium.launch(headless=True)
page = await browser.new_page()
await page.goto("https://example.com")
await page.screenshot(path="screenshot.png")
text = await page.text_content("body")
関連記事
実践のポイント
比較表
| 項目 | 従来 | AI統合 |
|---|---|---|
| 速度 | 数時間 | 数分 |
| 品質 | 変動あり | 一定 |
| コスト | 人件費 | API費用 |
ベストプラクティス
- 小さく始める
- 測定する
- 改善する
- 共有する
A
Agentive 編集部
AIエージェントを実際に使い倒す個人開発者。サイト制作の自動化を実践しながら、その知見を発信しています。