DUICUO

提案を自動生成する LLM を構築し、GitHub でオープンソース化しました。

翻訳者 | ブガッティ

校正者 | Chonglou

既存の大規模モデルでは問題を解決できなかったため、提案を効率的かつ自動的に生成する独自のオープンソース ツールを構築しました。

最近、オープンソースに関する記事の更新頻度が以前ほど高くありません。執筆をやめたわけではなく、オープンソースの商業化が大きく進展し、提案書の作成という果てしない作業に多くの時間を費やしているからです。

地元のオープンソース商用企業であるWhaleOpsは、主にエンジニアを雇用しています。これらのオープンソース貢献者に提案書の作成を依頼すると、開発時間が無駄になり、提案書の品質基準を満たすことが必ずしもできません。大企業の経営陣とは異なり、スタートアップのCEOは、会社が必要とするあらゆる役割を引き受けることを意味します。戦略会議の後は、いつも真っ先に袖をまくり上げて、最も緊急性の高いタスクに取り組みます。そのため、限られた時間は主に定型的なテンプレートに沿った提案書の作成に費やされ、記事を書く時間はありません。特に最近は、入札に完全に圧倒されていると感じています。

技術者として、私は常に問題を解決するためのツールを探しています。大規模なモデルは当然思い浮かびますが、製品のニュアンスを完全に把握することはできず、信頼性の低い出力を生成することも少なくありません。しかも、実際に作業を行うのはモデルではなく、あなた自身なのです。

そこで、ChatGPTと互換性のある大規模モデルをベースに、Pythonで提案書生成ツールを開発することにしました。このツールは、製品マニュアルを機能ポイントに分解し、製品ドキュメントから提案書を自動生成できます。これらの機能ポイントと要件を手動でマッピングすることで、Word形式の提案書とExcel形式の偏差表を生成します。このモデルは必要に応じて合理化・拡張することも、必要な機能だけを複製することも可能です。

オープンソース提案ツールの特徴

このツールの機能はシンプルですが、最も難しいのはWordの書式設定です(Wordの書式設定はいつも面倒です)。Wordテンプレートの見出し1、見出し2、見出し3、本文、表、画像の書式が正しく設定されていることを確認するために、いくつかの方法を試しました。オープンソースの精神に基づき、このツールはApacheライセンスの下で私の個人用GitHubにアップロードしましたので、必要に応じてご自由にお使いください。このツールの機能は次のとおりです。

  • 製品マニュアルを再利用可能な詳細なドキュメントに分割することで、提案書の作成時に元のドキュメントを繰り返し参照する必要がなくなります。また、特定の機能をカスタマイズすることも可能です(デフォルトのファイル名は「Template.docx」です)。
  • 個人が記入した要件フォームに基づいて、正しい見出し 1、見出し 2、見出し 3 形式を使用して、すべての見出しとコンテンツを含むポイントツーポイントの応答形式で提案書を自動的に生成し、本文、画像、重要なポイントを自動的に整理します (デフォルトの要件フォームは「requirements_table.xlsx」で、生成されたコンテンツは「proposal_content.docx」です)。
  • 対応する機能セクションの製品要件については、製品マニュアルのコンテンツがポイントツーポイントの回答セクションに自動的にコピーされ、画像、表、要点が保持されます。また、製品説明を書き換えて、さまざまな提案要件に適応させることもできます。一致する機能が見つからない場合は、モデルが関連コンテンツを自動的に生成します(必要に応じて確認および修正できます)。
  • 技術要件偏差表は、「requirements_table.xlsx」に回答が自動的に入力されることによって完成します。回答形式は「回答:完全にサポートされています、{プロジェクト要件に基づいてモデルが生成したテキスト}」で、提案に対応するセクション番号が含まれます。

このツールを使えば、提案書を素早く自由に修正・生成できます。こちらから入手できます: https://github.com/William-GuoWei/ProposalLLM。

提案作成プロセス

まず、`Extract_Word.py` を実行して製品の特徴ポイントを含む Word 文書を生成し、次に `Generate.py` を実行します。特徴ポイントが不足している場合は、Excel ファイルに「X」と入力すると、モデルがニーズに合ったコンテンツを生成します。ただし、手動で確認することを強くお勧めします。生成後、目次、本文、画像、表、要点がすべて自動的に整理されたフォーマット済みの提案書が表示されます。

提案書全体は、小見出し、コンテンツ、画像、ポイントツーポイントの回答など、クライアントの要件に沿って段階的に構成され、これにより反復的な作業はすべて処理されました。

自動生成される偏差表には、モデルによって生成されたかどうかに関係なく、すべてのコンテンツと対応するセクション番号が含まれます。最終的な要件に応じて「&」記号を使用して偏差表を完成させるだけで、モデルが既に作成済みです。

このツールのおかげで、以前は8時間かかっていた労働時間が約30分に短縮されました。また、ビジネスチームでもテンプレートを使ってビジネス提案書を作成できるようになりました。つまり、1週間かかっていた提案書作成プロセスが1~2日に短縮され、必要な人員も80%削減されました。

どうやって使うんですか?

まず、GitHub からすべてのコードをディレクトリ「Proposal Large Model (中国語版)」、https ://github.com/William-GuoWei/ProposalLLM にダウンロードします。

Python 環境とパッケージをインストールします: pip install openpyxl、docx、openai、requests、docx、Python-docx。

ChatGPT または Baidu Qianfan の大規模モデル キーを申請し (無料の ERNIE-Speed-8K を使用しました)、トークンを記録して、関連するコード セグメントに配置します。

製品マニュアルをTemplate.docxにコピーしてください。本文、見出し1、見出し2、見出し3のスタイルは必ず指定のものを使用してください。それ以外の書式設定は問題の原因となる可能性があります。

Extract_Word.py を実行すると、製品マニュアルから機能ポイントドキュメントが生成されます(最大3階層の見出しをサポート)。リストの書式設定が間違っていても心配ありません。最終的な書式設定は正しく整列されます。

列Bと列C(第2レベルと第3レベルの見出しが自動的に生成されます)および列G(対応する製品マニュアルの章)を入力してください。章が不足している場合は、「X」と入力してください。対応する章がない場合、または「X」と入力した場合は、モデルが自動的にコンテンツを生成します。

「proposal_content.docx」ドキュメントを表示し、提案書の作成を開始するセクションを保存します。本文と見出し1、2、3のスタイルは変更できますが、スタイル名を変更しないでください。変更するとエラーが発生する可能性があります。

Generate.py のパラメータを調整します。

  • API_KEY および SECRET_KEY: Baidu Cloud ビッグデータ モデル キー。
  • MAX_WIDTH_CM: 画像の最大幅。この値より大きい画像は自動的にサイズが変更されます。
  • コンテンツの生成に使用されるプロンプトは、ビッグ データのシナリオに合わせてカスタマイズされていますが、自由に変更できます。
  • MoreSection=1 は列 C を読み取って詳細な第 3 レベルの見出しを生成します (デフォルトで有効)。
  • ReGenerateText=0 は、さまざまな提案要件に合わせてテキスト コンテンツを自動的に再生成します (デフォルトはオフ)。
  • DDDAnswer=1 は、各特徴ポイントの上部にポイントツーポイントの応答コンテンツを生成します (デフォルトで有効)。
  • key_flag = 1 は、各要件の重要度レベルを提案タイトルに追加します (デフォルトで有効)。
  • Last_heading_1 = 2 は、「proposal_content.docx」内の技術ソリューションの開始セクションを指定します。

Generate.py を実行します。

要約

このツールを使えば、提案要件に沿って製品機能を確認するだけで、提案内容の大部分が自動的に生成されます。ビジネス提案セクションも同様の方法で生成できるため、1000ページの提案書の作成もわずか数分で完了します。

原題: 自動提案生成 LLM を構築し、GitHub でオープンソース化しました、著者: William Guo