
概要
「SEO記事作成におけるリサーチと構成案作成に時間がかかりすぎる」という課題を、DifyとGoogle Search API、Jina Reader(スクレイピング)の連携で解決しました。
特定のキーワードで検索上位1位〜20位の全記事をAIが瞬時に分析・統合。「情報の網羅性」において競合を圧倒する高品質な記事構成と本文を、わずか数分で自動生成します。
クライアントの課題とご要望
- 圧倒的な網羅性の確保: 上位サイトに含まれるトピックを漏れなく抽出した、日本一詳しい記事を作りたい。
- ノイズの除去: 記事構成の参考にならないWikipediaやニュースサイトなどを、ドメイン指定で除外して分析したい。
- コンテキスト制限の克服: 20記事もの膨大な情報をLLMに一度に読み込ませる際の精度低下やエラーを回避したい。
- 効率的なアウトプット: 生成されたタイトルや本文を、そのままクリップボードコピーやファイル出力(CSV/Word)したい。
実装した主な機能
- スマート・ドメインフィルタリング機能 Google Custom Search APIと連携し、指定したキーワードで20位までを取得。事前に設定した「除外ドメインリスト」に基づき、不要なサイトを自動で弾き、純粋な競合記事だけを20件ピックアップします。
- Jina Readerによるスクレイピング & 構造化分析 Jina Readerを活用し、各サイトからタイトル、H1〜H3の見出し、本文を抽出。膨大な情報をそのまま渡すのではなく、「見出し構造の抽出 → セクションごとの要約」というステップを踏むことで、LLMのコンテキスト制限を回避しながら論理的な一貫性を保つロジックを実装しました。
- 2ステップ・ライティング・ワークフロー いきなり執筆するのではなく、まず「最強の構成案(アウトライン)」を作成。ユーザーが構成を確認・修正した上で本文執筆に移ることで、手戻りのない効率的な制作フローを実現しました。
- マルチエクスポート対応 Dify上で生成されたコンテンツをワンクリックでクリップボードにコピー、またはファイルとしてエクスポートできるインターフェースを構築しました。
実際のワークフロー

システム構成 / 使用ツール
- AIプラットフォーム: Dify
- LLMモデル: Gemini 1.5 Pro(長文コンテキスト処理)/ GPT-4o-mini(コスト効率重視)
- 外部API: Google Custom Search API, Jina Reader API, Firecrawl
開発スピード・コスト
本システムは、検索・スクレイピング・多段要約・執筆といった多数のAPIステップが複雑に絡み合う高度なワークフローで構成されています。通常、これほど複雑なロジックをスクラッチで実装すると数週間を要しますが、Difyのワークフロー機能を最大限に活用することで、設計から実運用レベルの構築までわずか20時間というスピードで完遂しました。
圧倒的な低コスト運用: JinaとGPT-4o-miniの組み合わせを最適化することで、記事1本あたりの解析・生成コストを約10円〜20円(20サイト参照時)に抑えることに成功。外注コストと比較して劇的なROI(投資対効果)を実現しています