|
この記事では、1月にGitHubで最も人気があった11のPythonオープンソースプロジェクトを紹介します。これらのプロジェクトのうち、あなたが使ったことのある、あるいは現在使っているものはどれですか? 1.12306 https://github.com/testerSunshine/12306スター 6514 12306 Smart Ticket-Grabbing Assistantは、プログラマーによって書かれたチケット取得スクリプトです。この依存ライブラリはPythonバージョン2.7.10~2.7.15をサポートしており、その設計コンセプトは以下のとおりです。 2.py12306 https://github.com/pjialin/py12306スター 3408 これも 12306 チケット購入アシスタントであり、分散型、マルチアカウント、マルチタスクのチケット購入と Web ページ管理をサポートし、Python 3.6 以上をサポートしています。 3. 才能 https://github.com/zalandoresearch/flairスター 4893 Flair は、PyTorch をベースにした最近のオープンソースの NLP フレームワークで、次の機能を備えています。 Flair は、名前付きエンティティ認識 (NER)、品詞タグ付け (PoS)、意味の曖昧性解消、分類など、最先端の自然言語処理 (NLP) モデルをテキストに適用できる強力な NLP ライブラリです。 単一のモデルを使用して、複数のテキスト言語入力の PoS または NER トークンを予測できます。 Flair は、シンプルなインターフェースを備えたテキスト埋め込みライブラリで、作成者によって提案された Flair 埋め込み、BERT 埋め込み、ELMo 埋め込みなど、単語とドキュメントの埋め込みのさまざまな組み合わせを使用できます。 Flair は PyTorch 上に構築された PyTorch NLP フレームワークであり、独自のモデルを簡単にトレーニングできます。 4. pkuseg-python https://github.com/lancopku/pkuseg-pythonスター 2871 pkuseg は、シンプルで使いやすいドメイン固有の中国語単語分割ツールキットです。特定のドメイン内での分割をサポートし、分割精度を効果的に向上させます。pkuseg には以下の機能があります。 マルチドメイン単語分割は現在、ニュース、オンラインテキスト、混合ドメイン用の事前トレーニング済みの単語分割モデルをサポートしており、将来的にはさらに多くのモデルが追加される予定です。 より高いセグメンテーション精度: 他のセグメンテーション ツールキットと比較して、pkuseg は同じトレーニング データとテスト データを使用する場合に、より高いセグメンテーション精度を実現できます。 ユーザーがトレーニングしたモデルをサポートし、ユーザーが完全に新しいラベル付きデータを使用してトレーニングできるようにします。 5. 周りには何人いるか https://github.com/schollz/howmanypeoplearearoundスター 5568 howmanypeoplearearoundは、Wi-Fi信号を監視して周囲の人数を計算します。例えば、自宅にいる人数や寮のルームメイトの人数を計算するのに使用できます。Linux(RaspbianとUbuntu)とMac OS Xで既にテスト済みです。 6. システム設計入門 https://github.com/donnemartin/system-design-primerスター 56017 このプロジェクトは、大規模システムの設計方法とシステム設計面接の準備方法に焦点を当てています。システム設計は幅広いテーマです。システム設計の原則に関するリソースはオンラインで無数に提供されています。このリポジトリは、これらのリソースを整理してまとめたものであり、スケーラブルなシステムの構築方法を学ぶのに役立ちます。 7. 素晴らしいPythonアプリケーション https://github.com/mahmoud/awesome-python-applicationsスター 6230 これはPythonプログラムのコレクションです。必要なPythonプロジェクトを素早く見つけるのに役立つだけでなく、日々の開発におけるリファレンスとしても役立ちます。現在195個のオープンソースPythonプログラムが含まれており、その数は増え続けています。トピック別に整理されており、ライブラリやドキュメントへのリンクも含まれています。開発セクションはさらに11のモジュールに分かれています。 8. 楽しいNLP https://github.com/fighting41love/funNLPスター 455 中国語 NLP 語彙集には、中国語と英語の敏感な単語、言語検出、中国および海外の携帯電話/電話の位置/通信事業者の検索、名前からの性別の推論、携帯電話番号の抽出、ID カードの抽出が含まれます。 9.モデル https://github.com/tensorflow/modelsスター 47957 TensorFlow を使用して構築されたモデルと例に関するチュートリアルを含む TensorFlow ライブラリ。最新の TensorFlow API をより適切にメンテナンス、テストし、最新の状態に維持できるように設計されています。 モデルの TensorFlow 実装は、https://github.com/tensorflow/models/blob/master/research で確認できます。 TensorFlow チュートリアル: https://github.com/tensorflow/models/blob/master/tutorials 10. 素晴らしいPython https://github.com/vinta/awesome-pythonスター 60906 これはPythonプログラムのコレクションです。必要なPythonプロジェクトを素早く見つけるのに役立つだけでなく、日々の開発におけるリファレンスとしても役立ちます。現在195個のオープンソースPythonプログラムが含まれており、その数は増え続けています。トピック別に整理されており、ライブラリやドキュメントへのリンクも含まれています。開発セクションはさらに11のモジュールに分かれています。 11. コピートランスレータ https://github.com/elliottzheng/CopyTranslatorスター 2034 このオープンソースプロジェクトは、英語力に限りのある開発者にとってまさに天の恵みです。CopyTranslatorを開いてPDFテキストを直接コピーするだけで、CopyTranslatorがクリップボードの変更を検知し、クリップボードの内容を処理し(余分な改行を削除するなど)、翻訳結果を表示してくれるからです。Webベースの翻訳プラットフォームに直接コピー&ペーストするよりも、翻訳品質が大幅に向上し、翻訳時間も大幅に短縮されます。 |