DUICUO

オープンソース検索エンジンYaCyの使い方のヒント

[[315864]]

他の人の意見に従うのではなく、YaCY 検索エンジンを使用して、必要なインターネットを定義してください。

前回の紹介記事で YaCy について説明しました。相互関係ピアツーピアここでは、YaCyのような検索エンジンのインストール方法と使用方法について説明します。YaCyの最も魅力的な点の一つは、本質的にローカルクライアントであるということです。世界中のすべてのYaCyユーザーは、この分散検索エンジンアーキテクチャにおけるノードであり、各ユーザーが独自のインターネット検索エクスペリエンスを制御できるのです。

Googleはかつて、google.com/linux のようなLinux関連の検索結果を素早くフィルタリングするシンプルな機能を提供していました。この機能は非常に人気がありましたが、Googleは2011年に廃止されました。

一方、YaCy ではカスタム検索エンジンが可能になります。

カスタムYaCy

YaCyをインストールしたら、 localhost:8090アクセスするだけで使用できます。検索エンジンをカスタマイズするには、右上の「…」ボタンをクリックしてください。管理管理「ボタン(小さい画面ではメニューアイコンに隠れている場合があります)。

管理パネルでは、YaCy のシステム リソース使用ポリシーと他の YaCy クライアントとのやり取り方法を設定できます。

YaCy プロファイルセレクター

たとえば、「サイドバー内」をクリックします最初のステップ最初のステップ「」ボタンを使用すると、代替ポートを構成し、YaCyのメモリとハードドライブの使用率を設定できます。一方、「モニター監視パネルではYaCyの動作を監視できます。以下のよく使われる機能をはじめ、ほとんどの機能はパネル上で数回クリックするだけで実行できます。

イントラネット検索アプリケーション

多くの企業がイントラネット検索アプリケーションを提供しており、YaCyも無料で提供しています。YaCyはHTTP、FTP、Sambaなどのプロトコル経由でアクセス可能なファイルをインデックス化するため、企業内のプライベートファイル検索とローカル共有ファイル検索の両方に適しています。社内ネットワーク上のユーザーは、社内ネットワーク外のユーザーには見えないまま、個人用のYaCyインスタンスを使用して共有ファイルを見つけることができます。

ネットワーク構成

YaCyはデフォルトでプライバシーと分離をサポートしています。「ユースケースとアカウントユースケースとアカウント「ページの上部に」ネットワーク構成ネットワーク構成「リンク」をクリックすると、ネットワーク構成パネルに移動し、ピアツーピア ネットワークを設定できます。

YaCyネットワーク構成

クロールサイト

YaCyの分散運用とは、ページクロールがユーザー主導であることを意味します。インターネット上のアクセス可能なすべてのページを検索する大企業が存在しないのと同様に、YaCyはユーザーが指定した場合にのみサイトをクロールし、インデックスを作成します。

YaCy クライアントでは、ページをクロールする方法が 2 つあります。手動でクロールするか、YaCy に提案に基づいてクロールさせることができます。

YaCy 高度なクローラー

手動クロール

手動クロールとは、ユーザーが特定のウェブサイトのURLを入力し、YaCyクローラータスクを開始することです。「…」をクリックするだけです。高度なウェブクローラー高度なクローラークロールする予定の URL を入力し、ページの下部にあるオプションを選択します。リモートインデックスを実行するリモートインデックス作成このオプションを使用すると、クライアントはインデックスを作成する URL をインターネットにブロードキャストできます。これらのリクエストを受け入れるクライアントは、これらの URL のクロールを支援できます。

ページの下部にある「…」をクリックします新しいウェブクロールタスクを開始する新しいクロールジョブを開始ボタンを押すとクロールプロセスが開始されます。これは、よく使われる便利なウェブサイトをクロールしてインデックスする方法です。

クローラータスクが開始されると、YaCy はこれらの URL に対応するページのインデックスを生成し、ローカルに保存します。ローカルコンピュータがポート 8090 との間のトラフィックを許可しているアドバンスモードでは、ネットワーク上のすべての YaCy ユーザーがこのインデックスを使用できます。

ウェブクローラーネットワークに参加する

YaCy の熱心なユーザーの中には、インターネット上の数え切れないほどのページを執拗にクロールしている人もいますが、利用可能なウェブページの膨大な量に比べれば、これはほんの一握りに過ぎません。ユーザー一人のリソースは大企業のウェブクローラーのリソースに比べればはるかに少ないですが、YaCy ユーザーの大規模なコミュニティが生み出す力は計り知れません。YaCy のクロールリクエストブロードキャスト機能を有効にすると、他のクライアントもさらに多くのページのクロールに参加できるようになります。

新着情報高度なウェブクローラー高度なクローラーパネルのページ上部にある「…」ボタンをクリックします。リモートクロールリモートクロール、 チェック "負荷負荷その横にあるチェックボックスをオンにすると、クライアントは他のユーザーからの Web スクレイピング リクエストを受け入れることができます。

YaCyリモートクロール

YaCyモニタリング関連

YaCyは非常に強力な検索エンジンであるだけでなく、豊富なテーマと優れたユーザーエクスペリエンスも提供しています。「モニターモニター「パネルは YaCy クライアントのネットワーク ステータスを監視し、YaCy コミュニティから必要なものを入手した人の数も表示できます。」

YaCy監視画面

検索エンジンが役割を果たしました。

YaCyを長く使うほど、検索エンジンの視点がどのように変化しているかを深く考えるようになるでしょう。なぜなら、インターネット体験の大部分は、単純な検索の結果から得られるからです。実際、様々な業界の人と話すと、「インターネット」に対する理解が人それぞれ異なることに気づくかもしれません。インターネット検索エンジンは広告やプロモーションだらけで、検索結果から得られる情報は限られていると考える人もいます。例えば、誰かがキーワードXに関するコンテンツを検索し続けているとします。ほとんどの商用検索エンジンは、検索結果におけるキーワードXの重み付けを高めますが、同時に別のキーワードYの重み付けを相対的に下げるため、たとえ特定のタスクの達成により適しているとしても、キーワードYは検索結果に埋もれてしまいます。

現実世界と同じように、仮想世界から一歩踏み出すと、より広い世界が目の前に広がります。YaCyを使って、どんな発見があるか、ぜひ体験してみてください。