DUICUO

GitHub 上の興味深い最先端のオープンソース プロジェクト 11 選

ここ数日、何人かの友人から個人的にメッセージが届きました。最近見つけた短編映画が検閲されているとのことで、検閲を解除できる高度な技術があるのか​​どうか、検閲なしで観る方がずっと快適だと聞いてきました。私も、一体どんな映画にそんな高度な技術が必要なのか、気になっていました。実は、少し技術的な知識があれば、解決できないことはありません。必要なのは、ただ努力と時間だけです。自慢話はこれくらいにして、本題に戻りましょう。

今日は、GitHubで公開されている、興味深くて素晴らしいオープンソースプロジェクトを11個ご紹介します。私自身も時々使っていますが、便利で楽しく、多くの問題の解決に役立つので、皆さんにもご紹介することにしました。楽しんでいただければ幸いです!

Github (7k): https://github.com/adamian98/pulse

PULSE - このオープンソース プロジェクトでは、画像にピクセルを追加することで、ピクセル除去や画像のレタッチを実現できます。

モザイク:人類文明の障害であり、オタクの宿敵であり、熟練ドライバーの悪夢。モザイクの誕生以来、人類とモザイクの闘いは終わらない。

プログラマーにとって、女性から最もよく聞かれる質問は「オペレーティングシステムのインストール方法は?」だとしたら、男性から最もよく聞かれる質問は間違いなく「ピクセル化を除去するには?」でしょう。

モザイクを削除できるかどうか尋ねられたら、明確に答えることができます。いいえ、モザイクは元に戻せません。

でも、でも!想像力を働かせればいいじゃないですか?あんなのをたくさん見てきたら、検閲された部分がどんなものか分かるでしょう?でも普通の人、つまり普通の人なら、たとえ数え切れないほどの映画を見てきたとしても、厳しく検閲された美しい女性の写真を見せられたら、彼女の容姿を想像するのはとても難しいでしょう。それには2つの理由があります。

1. あなたは美しい女性の写真を十分に見ていない。

2. 「モザイク加工された美女」と「オリジナル画像の美女」の間に関連性が確立されていません

「私は食べたり飲んだりしない。ただ美しい女性の写真とそのピクセル化されたバージョンを見るだけだ」と言う人がいます。しかし、十分に見てきた後に、美しい女性のピクセル化された写真を見せられたら、私はすぐに彼女の容姿を想像できるでしょうか?

わあ、それはかなり巧妙ですね。「心の中で無修正、それが高解像度」って、こういう意味ですか?

写真の通り:

デピックス

Github (23.1k): https://github.com/beurtschipper/Depix

Depix - ぼやけたテキストから検閲を削除します。

写真の通り:

テコガン

Github (5.1k): https://github.com/thunil/TecoGAN

TecoGAN はビデオのモザイクを削除したり、超解像度化を実行したりします。

写真の通り:

リアルタイム音声クローン

Github (38.3k): https://github.com/CorentinJ/Real-Time-Voice-Cloning

リアルタイム音声クローニング - たった 5 秒間の音声で、あなたが話したあらゆる内容を生成できるため、非常に不安になります。

以下に、より詳細なユーザーガイドを記載します。問題が発生した場合は、ヘルプセクションをご参照ください。

https://www.bilibili.com/video/av79481223?zw

https://blog.csdn.net/weixin_41010198/article/details/113186232

このモデルを試してみたのですが、外国人がオープンソースで公開しているだけあって、学習データは英語の音声です。中国語で話してみたところ、中国語を全く話せない外国人と全く同じ発音になってしまいました。今、世界の現実に疑問を感じています。

写真の通り:

スキンディープ

Github (38.3k): https://github.com/vijishmadhavan/SkinDeep

SkinDeep - ワンクリックで写真やビデオからタトゥーを除去する最先端テクノロジー。

驚くべきことに、このオープンソースプロジェクトはGitHub上に存在します。インドのアルゴリズム研究者であるVijish Madhavan氏が、有名人のタトゥーを自動除去できる機械学習ツール「SkinDeep」をオープンソース化しました。

このツールを使って、濃いタトゥーを入れた人の写真を加工してみましたが、なかなか良い結果になりました。以下は、アレン・アイバーソン(アメリカのバスケットボール選手)のタトゥー除去前後の比較です。

写真の通り:

スタイルクリップ

Github (3.2k): https://github.com/orpatashnik/StyleCLIP

StyleCLIP - AI搭載の自動写真編集。ほうきのような髪型のイーロン・マスクを見たことはありますか?

前回のプロジェクトでは、Photoshopに匹敵する成果を上げ、AIの威力を示しました。次のプロジェクトは、写真を自動的に編集する点で本当に素晴らしいです。

こんなシナリオを想像したことがありますか。元の画像を見て、「Photoshop でかっこいい前髪に加工して」と言うと、なんと、かっこいい前髪の写真が自動的に生成されるのです。

写真の通り:


ポリグロット-png

Github (3.2k): https://github.com/DavidBuchanan314/tweetable-polyglot-png

polyglot-png - ダウンロードするのは単なる画像です。ファイル拡張子を変更するだけで、曲やコードの文字列になります。

外国人ハッカーのデビッド・ブキャナンはツイッターの脆弱性を悪用し、サイズが3MBを超えない範囲で、画像に偽装した「暗号化」ファイルを送信した。

彼は、この隠しファイルの GitHub ソースコードを画像に圧縮することに成功しました。

今必要なのは、彼の Twitter にアクセスしてこの画像をダウンロードし、ファイル拡張子を .png から .zip に変更して GitHub コードに抽出するだけです。

画像で圧縮ファイルを隠す原理は複雑ではありません。PNG画像ファイルのフォーマットは次のとおりです。Zlibの後にIDATデータブロックが追加され、ここに隠蔽データが配置されます。

圧縮ファイル付きの画像URL: https://i.imgur.com/kNhGrN3.png

デビッド・ブキャナンのツイッター: https://twitter.com/David3141593/status/1371974874856587268

写真の通り:

ResnetGPT

Github (2.2k): https://github.com/FengQuanLi/ResnetGPT

ResnetGPT - 人工知能に Honor of Kings をプレイさせるためのモデルをトレーニングする方法を教えます。

このオープンソースプロジェクトはどのように実装されているのでしょうか?次の図は、このモデルのコアコードを示しています。難しくはありませんので、ステップごとに分解し、これらのテクノロジーを分かりやすく説明していきます。

コンピュータにゲームをやらせることは、以下のステップに分解できます。これは比較的簡単に実装でき、「強化学習」は使用しません。一方、囲碁界を席巻したAlphaGoアルゴリズムは強化学習に基づいています。

1. 現在のゲームインターフェースを取得します。これには、ヒーローの現在のステータス、近くに敵ヒーローやミニオンがいるかどうかなどが含まれます。

2. 現在のゲーム インターフェースの状態に基づいて、前進、攻撃、スキルの発動などの操作コマンドを生成します。

3. 生成された操作指示に従って携帯電話を操作すると、ヒーローが対応するアクションを実行します。

これは民間レベルのAIモデルをトレーニングするための一般的なプロセスです。現在のゲームインターフェースを取得し、指示に従ってスマートフォンを制御するための成熟した技術が存在します。

例えば、このプロジェクトではscrcpyを使ってAndroidスマートフォンの画面ミラーリングを実現しています。このAndroid画面ミラーリングツールは、ゲーム画面をコンピューターのデスクトップにミラーリングできます。

ゲーム画面が表示されれば、私たちは戦闘の現状を把握できます。ゲーム画面は画像形式であり、人間は画像の内容を理解することができますが、コンピューターは理解できません。

これには、画像から特徴を自分で抽出する必要があり、ここでディープラーニング アルゴリズムが役立ちます。画像の特徴を抽出するために、畳み込みニューラル ネットワーク (CNN) を使用します。このプロジェクトでは、ResNet 101 分類ネットワークを使用しています。

この畳み込みニューラル ネットワークをトレーニングすることで、ネットワークはゲーム画面から特徴を抽出する能力を獲得し、アルゴリズムが次の操作コマンドを生成できるようになります。

写真の通り:

インテリジェントUAVパスプランニング

gitee: https://gitee.com/wwy2018/intelligent-uavpath-planning-simulation-system-S

インテリジェント UAV パス プランニング - このプロジェクトは、インテリジェント UAV パス プランニング シミュレーション システムです。

このプロジェクトは、精密な操作制御、強力なプラットフォーム統合、全方向への自動モデル構築と適用などの利点を持つ、インテリジェントな無人航空機(UAV)経路計画シミュレーション システムです。

C地域におけるA国とB国間のドローン戦争を背景に、このシステムの中核機能は、シミュレーションプラットフォームを通じてドローンの飛行経路を計画し、結果を検証して出力することである。実際のドローンからデータをインポートすることで、ドローンは所定の経路に沿って戦場の任意の場所に正確に到達し、複数人、複数デバイスによる協調作戦をサポートする。

写真の通り:

エッセイキラー_V2

Github (4.9k): https://github.com/EssayKillerBrain/EssayKiller_V2

EssayKiller_V2 - ある人が3ヶ月でエッセイを書けるAIを開発しました。

一般的に、大学入試の小論文で満足のいく点数を取るには、大量生産型の定型的な訓練が必要だと言われています。しかし実際には、生徒をまるでライティングマシンのように訓練し、大量の模範小論文やライティングパターンを与え、長期にわたる学習を行わせるのです。ちょっと待ってください。これは人工知能の訓練プロセスと同じではないでしょうか?

では、人工知能システムに同じデータを与えれば、エッセイを書くように教えることができるのでしょうか?

答えは、もちろん「イエス」です。ビリビリUPの達人「チューリングの猫」は、「言葉よりも行動が雄弁」という哲学を貫き、3ヶ月、500時間、1万行のコード、2億個のデータポイント、17億個のパラメータを使って、エッセイを書ける人工知能「EssayKiller」を独力で開発しました。

写真の通り:

スタイル2ペイント

Github: https://github.com/lllyasviel/style2paints

style2paints - 環境のインストールや設定は不要です。ダウンロードしてダブルクリックするだけで線画に色を塗ることができます。

このAIプロジェクトは、アニメやマンガファンにとってまさに宝物です。AI駆動型ですが、インストールや設定は不要です。ダウンロードしてダブルクリックするだけで、線画に色を塗ることができます。

写真の通り: