Apache ManifoldCF Shinichiro Abe [email_address]
Apache ManifoldCF Apache Incubator Apache 2.0 license 2010 〜 Manifold Connector Framework Solr ← MCF ← web + non‐web repositories Solr との親和性、セキュリティを考慮した検索。使いやすさ。
Apache Solr Solr Cell index Apache ManifoldCF Web, RSS Windows shares File System JDBC  Oracle - SQLServer - Postgresql CMIS OpenSearchServer LiveLink (OpenText) Documentum (EMC) Meridio (Autonomy) SharePoint (Microsoft) FileNet (IBM) Connector  Active Directory Output Connector Repository Connector Authority Connector Metadata Contents Access Token
Agent Connection - Job - Crawler Agent  Output Connector Repository Connector Connection 1 - Solr Connection 2 - Solr Connection 3 Connection 1 - File System Connection 2 - Windows Shares Connection 3 - Database Job Crawler Agent Job 1 Job 2
Crawler Agent JOB のコントロール    コネクション管理    クロール詳細設定    スケジュール管理     定時 / 定期 実行      1 回 / 連続 実行 DB による取り込み document の変更管理・履歴管理 PostgreSQL
Windows サーバのクロール 共有サーバ     社内ファイル共有サーバ     さまざまなファイル種類     ドメイン環境、アクセス許可、セキュリティ      MCF がクロールし、コンテンツ+セキュリティ情報を Solr へ投入 社内コンテンツサーチを実現できる    営業の人が営業の資料を検索する     独自セキュリティ設定する必要がない
Windows サーバのクロール JCIFS.jar      SMB プロトコルでフォルダ / ファイルのアクセス     フォルダ / ファイルが持つアクセストークン (SID) の取得      -> Solr field でセキュリティ情報をインデックス化              allow_token_share  フォルダのアクセス許可リスト              allow_token_document   ファイルのアクセス許可リスト              deny_token_share      フォルダのアクセス拒否リスト              deny_token_document  ファイルのアクセス拒否リスト   Solr Cell     ファイルコンテンツの抽出
 
 
 
Filter Query Apache Solr index Metadata Contents Access Token Apache ManifoldCF Authority Connector Connection 1 Active Directory Search Request Modified Request Filtered Result [email_address] Access Token セキュリティを考慮した検索
ManifoldCF の特長 社内コンテンツサーチ向け、導入・設定が簡単     ファイルサーバ      Windows 共有サーバ      JDBC 経由のデータベース     その他のレポジトリ クローラの独自実装 / セキュリティの独自実装が必要ない Apache ManifoldCF vs. Google Connector Framework      UI あり / なし     対応コネクタ差異      Solr Connector/GSA
ManifoldCF の資料 Upcoming 0.3 or trunk     http://svn.apache.org/repos/asf/incubator/lcf/trunk ManifoldCF in Action     http://www.manning.com/wright/    ロンウイットの記事     http://www.rondhuit.com/apache-manifoldcf.html

More Related Content

PPTX
.NETからActive Directoryにアクセス
PPTX
.NETからActive Directoryデータにアクセス ~ユーザ情報の取得と表示~
PPTX
Solr 4.0 の主な機能
PPTX
.NETからActive Directoryデータにアクセス ~プリンタ情報の取得と表示~
PPTX
.NETからActive Directoryデータにアクセス ~共有フォルダ情報の取得と表示~
PPTX
Solr6 の紹介(第18回 Solr勉強会 資料) (2016年6月10日)
PPTX
.NETからActive Directoryデータにアクセス ~コンピュータ情報の取得と表示~
PPTX
.NETからActive Directoryデータにアクセス ~グループ情報の取得と表示~
.NETからActive Directoryにアクセス
.NETからActive Directoryデータにアクセス ~ユーザ情報の取得と表示~
Solr 4.0 の主な機能
.NETからActive Directoryデータにアクセス ~プリンタ情報の取得と表示~
.NETからActive Directoryデータにアクセス ~共有フォルダ情報の取得と表示~
Solr6 の紹介(第18回 Solr勉強会 資料) (2016年6月10日)
.NETからActive Directoryデータにアクセス ~コンピュータ情報の取得と表示~
.NETからActive Directoryデータにアクセス ~グループ情報の取得と表示~

Viewers also liked (8)

PDF
Apache ManifoldCF
PPTX
Super Size Your Search
PPTX
Integrating Alfresco with Portals
PDF
Getting started with Imagemagick
PDF
Alfresco WebScript Connector for Apache ManifoldCF
PPTX
mchristy-DH2014-emop-bookhistory-tools
PPTX
Integrate ManifoldCF with Solr
PDF
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell
Apache ManifoldCF
Super Size Your Search
Integrating Alfresco with Portals
Getting started with Imagemagick
Alfresco WebScript Connector for Apache ManifoldCF
mchristy-DH2014-emop-bookhistory-tools
Integrate ManifoldCF with Solr
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell
Ad

Recently uploaded (12)

PDF
20250823_IoTLT_vol126_kitazaki_v1___.pdf
PDF
Yamaha DT200WR Real Enduro ENGINE CYLINDER TRANSMISSION
PPTX
生成AIとモデルベース開発:実はとても相性が良いことを説明します。まあそうだろうなと思われる方はご覧ください。
PDF
翔泳社 「C++ ゼロからはじめるプログラミング」対応 C++学習教材(三谷純)
PDF
R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual...
PPTX
Vibe Codingを触って感じた現実について.pptx .
PDF
Working as an OSS Developer at Ruby Association Activity Report 2025
PDF
ココロ分解帳|感情をやさしく分解し自分と他者を理解するためのモバイルノートアプリ
PDF
20250826_Devinで切り拓く沖縄ITの未来_AI駆動開発勉強会 沖縄支部 第2回
PPTX
Cosense - 整えずして完全勝利!Cosenseが他のwikiツールと違う理由
PDF
Geminiの出力崩壊 本レポートは、Googleの大規模言語モデル「Gemini 2.5」が、特定の画像と短文入力に対して、誤った地名を推定し、最終的に...
20250823_IoTLT_vol126_kitazaki_v1___.pdf
Yamaha DT200WR Real Enduro ENGINE CYLINDER TRANSMISSION
生成AIとモデルベース開発:実はとても相性が良いことを説明します。まあそうだろうなと思われる方はご覧ください。
翔泳社 「C++ ゼロからはじめるプログラミング」対応 C++学習教材(三谷純)
R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual...
Vibe Codingを触って感じた現実について.pptx .
Working as an OSS Developer at Ruby Association Activity Report 2025
ココロ分解帳|感情をやさしく分解し自分と他者を理解するためのモバイルノートアプリ
20250826_Devinで切り拓く沖縄ITの未来_AI駆動開発勉強会 沖縄支部 第2回
Cosense - 整えずして完全勝利!Cosenseが他のwikiツールと違う理由
Geminiの出力崩壊 本レポートは、Googleの大規模言語モデル「Gemini 2.5」が、特定の画像と短文入力に対して、誤った地名を推定し、最終的に...
Ad

Apache ManifoldCF

  • 1. Apache ManifoldCF Shinichiro Abe [email_address]
  • 2. Apache ManifoldCF Apache Incubator Apache 2.0 license 2010 〜 Manifold Connector Framework Solr ← MCF ← web + non‐web repositories Solr との親和性、セキュリティを考慮した検索。使いやすさ。
  • 3. Apache Solr Solr Cell index Apache ManifoldCF Web, RSS Windows shares File System JDBC Oracle - SQLServer - Postgresql CMIS OpenSearchServer LiveLink (OpenText) Documentum (EMC) Meridio (Autonomy) SharePoint (Microsoft) FileNet (IBM) Connector Active Directory Output Connector Repository Connector Authority Connector Metadata Contents Access Token
  • 4. Agent Connection - Job - Crawler Agent Output Connector Repository Connector Connection 1 - Solr Connection 2 - Solr Connection 3 Connection 1 - File System Connection 2 - Windows Shares Connection 3 - Database Job Crawler Agent Job 1 Job 2
  • 5. Crawler Agent JOB のコントロール    コネクション管理    クロール詳細設定    スケジュール管理     定時 / 定期 実行      1 回 / 連続 実行 DB による取り込み document の変更管理・履歴管理 PostgreSQL
  • 6. Windows サーバのクロール 共有サーバ     社内ファイル共有サーバ     さまざまなファイル種類     ドメイン環境、アクセス許可、セキュリティ      MCF がクロールし、コンテンツ+セキュリティ情報を Solr へ投入 社内コンテンツサーチを実現できる    営業の人が営業の資料を検索する     独自セキュリティ設定する必要がない
  • 7. Windows サーバのクロール JCIFS.jar      SMB プロトコルでフォルダ / ファイルのアクセス     フォルダ / ファイルが持つアクセストークン (SID) の取得     -> Solr field でセキュリティ情報をインデックス化              allow_token_share フォルダのアクセス許可リスト              allow_token_document   ファイルのアクセス許可リスト              deny_token_share      フォルダのアクセス拒否リスト              deny_token_document ファイルのアクセス拒否リスト   Solr Cell     ファイルコンテンツの抽出
  • 8.  
  • 9.  
  • 10.  
  • 11. Filter Query Apache Solr index Metadata Contents Access Token Apache ManifoldCF Authority Connector Connection 1 Active Directory Search Request Modified Request Filtered Result [email_address] Access Token セキュリティを考慮した検索
  • 12. ManifoldCF の特長 社内コンテンツサーチ向け、導入・設定が簡単     ファイルサーバ      Windows 共有サーバ      JDBC 経由のデータベース     その他のレポジトリ クローラの独自実装 / セキュリティの独自実装が必要ない Apache ManifoldCF vs. Google Connector Framework      UI あり / なし     対応コネクタ差異      Solr Connector/GSA
  • 13. ManifoldCF の資料 Upcoming 0.3 or trunk     http://svn.apache.org/repos/asf/incubator/lcf/trunk ManifoldCF in Action     http://www.manning.com/wright/    ロンウイットの記事     http://www.rondhuit.com/apache-manifoldcf.html