MapR、Pentaho、Hadoop Summitで新リリースを発表

サンフランシスコで開催されているApple Worlwideデベロッパーコンファレンスでは誰もが驚いているかもしれませんが、Big Dataの世界は、HadoopディストリビューションのHortonworksによって運営されているHadoop Summitを集め、サンノゼの半島の一番下にあります。

ビッグデータ分析、Big Data Analytics、DataRobotはデータサイエンスの欠点を自動化することを目指している、Big Data Analytics、MapR創設者のJohn Schroederが辞任し、交換するCOO

このイベントは木曜から午後にかけて行われ、間違いなくニュースのサイクルを迎えます。実際には、いくつかのニュースはすでに今朝壊れています。

MapR CincO; Hadoop SummitがHortonworksによって運営されているにも関わらず、HadoopディストリビューションベンダーのMapRは、このイベントに関連して独自のいくつかの発表を行いました。すべてMapR 5.0のリリース

まず、MapR-DB(同社のHBase互換運用データベース)とElasticsearchのリアルタイム統合を含む新しいリアルタイム複製機能がMapRに追加されたことを発表しました。このようなリアルタイム統合により、多くのビジネスシナリオでは受け入れられない検索結果に遅延を生じさせるバッチ更新プロセスに頼るのではなく、Elasticsearchの検索インデックスを最新の状態に保ちます。

Governing Hadoop;リアルタイム機能以外にも、MapRはMapRディストリビューションを高度に規制された業界設定で使用できる監査機能を追加しています。監査データ(データやメタデータの変更だけでなく、非常に詳細なユーザーアクティビティを本質的に追跡する)は、JSON(JavaScript Object Notation)ログファイルに保存され、後でその形式と互換性のある幅広いツールで消費されます。

またMapRは、MapR 5.0の一部となるDrill v1.1には、特定の列のみを含むテーブルの表示を可能にする新しい保護されたビュー機能が含まれ、これらのビューを特定のユーザーおよびグループに割り当てることができると発表しました。これらのビューを作成し、基になるテーブルへのアクセスを削除することで、MapRの顧客は、テーブル内の特定の列が特定のユーザーに表示されないようにすることができます。これは、PII(個人を特定できる情報)を含む可能性のある表に対して特に重要です。ビューを使用して、特定のユーザーまたはグループにカスタムデータセット(特定の行のデータ、カスタム列、カスタム結合、またはその両方を含む)を公開することもできます。

開示:私は、これらのガバナンス機能を組み込むことをMapRと提携しているDatameer社で働いています。

Drill 1.1に加えて、MapR 5.0には、Hadoop 2.7、Spark 1.3、Hive 1.1、Sentry 1.5、およびSqoop 1.99.5が含まれています。

Auto-Provisioning Templates、または:なぜユーザーを雲の上らせるべきかMapR 5.0のもう1つの要素は、Auto-Provisioning Templatesの追加です。これらのテンプレートは、Hadoopクラスタをプロビジョニングし、使用するライセンスと含まれる正確なコンポーネントを指定するブラウザベースのステップバイステップのインターフェイスを効果的に提供します。

これは、AmazonがElastic MapReduce用に提供するWizard主導のユーザーインターフェイスと非常によく似ているため、Hive、HBase、Hueなどのコンポーネントをクラスタにインストールするかどうかを選択できます。このようなインターフェイスは非常に役に立ち、クラウドベースのクラスタに限定する必要はありません。オンプレミスのHadoopクラスタでは、このような機能を使用することをお勧めします。

先週の買収契約が閉鎖されたPentahoも、Pentaho 5.4のリリースに伴い、すべて公表されている

今回の新リリースでは、Amazon Elastic MapReduceのサポートにより、クラウドベースのHadooop統合が容易になりました。 SAP HANAとの統合も含まれています。 Apache SparkのサポートがPentaho Data Integration(PDI)に追加され、PDIがSparkジョブを調整できるようになりました。 Pentaho氏によると、PDIのルック・アンド・フィールも更新されました。また、Pentahoをカスタムおよび商用アプリケーションにBI機能を組み込むためのさらに強力なソリューションにするための新しいAPIが追加されました。

Hadoop Summitイベントではもっと多くのニュースが出てくるでしょう。私はイベントの全体のためにオンサイトになるでしょう、すべてそれを麻痺させる。

開示:私はMapR 5.0にデータガバナンス機能を組み込むことを目的として、MapRと提携しているDatameer社で働いています。

LinkedInが新しいブログプラットフォームを発表

これはBig OLAPの時代ですか?

DataRobotは、データサイエンスの果実を自動化することを目指しています

MapRの創設者John Schroederが辞任し、COOが辞任