丸紅I-DIGIO × Insight Technology

Insight Masking

Insight Maskingロゴ

大規模言語モデルを活用した、個人情報を
速く・正確に匿名化するデータマスキングソフトウェア

個人情報などの機密情報をマスキングで匿名化。
非本番環境へのデータコピー、環境移行のテスト、データ分析などの場面で、
情報漏洩のリスクを低減する。

Insight Maskingの特徴

01日本語に対応したデータマスキング、豊富なマスキング設定ルールにより様々な利用シーンに対応

データのユニーク性、参照性・整合性などデータの論理的特性をそのままにマスキング。
データの種類・分布などのデータの統計的特性も維持したままのテストデータを生成します。

テストデータ生成

不十分なデータでのテストによる不具合の防止や短期間でのデータ準備、性能評価に利用可能なテストデータとして、開発サイクルの効率化に貢献します。

データのクラウド移行検証

データ持ち出し時にセキュリティを担保しながら機能面のテストや性能評価を行うことができ、クラウド移行準備の工数削減に貢献します。

分析データの準備

個人情報を含むデータのマスキング、更にマスキングデータ作成フローの自動化により、セキュリティリスクを抑止。
ビジネスユーザーが利用できる分析用データを作成できます。

サマリー

  • DB移行時に元データの特徴そのままにテストデータで検証が可能
  • クラウド移行時のPoC(事前検証)におけるセキュリティの担保
  • 個人情報を匿名加工したデータを協力企業や自社でのデータ分析の現場に提供可能

02日本語に最適化されたAIエンジンによる個人情報の自動抽出

自社開発の高性能AIエンジンで日本語(ひらがな、カタカナ、漢字)に最適化。
英数字や記号など文字種を判別して、ファイルやデータベースのカラム・文章データから個人情報を自動抽出します。
ユーザーが独自ルールを定義することで、より細かな抽出が可能になります。

  • データベースやCSVファイル等からマスキング対象のデータ項目を検出
  • メール、チャット等のフリーテキストから、匿名処理の対象に該当する単語を検出

フリーテキスト(テキスト文章、メール etc.)から、該当する単語を検出

不十分なデータでのテストによる不具合の防止や短期間でのデータ準備、性能評価に利用可能なテストデータとして、開発サイクルの効率化に貢献します。

検出可能なデータ(ラベル)

実データを解析して、匿名化対象の個人情報・機密情報を検出。該当データのカラムに自動でラベル付けが行われます。

03高速な処理性能

Insight Maskingはデータ加工処理のパラレル化により、これまで大量のマスキング処理にかかっていた膨大な時間を劇的に圧縮。データマスキングに必要な工数を削減します。

Insight Maskingの機能

日本語に最適化された高性能AIエンジンにより、匿名化候補文字列の自動検出と自然な変換で豊富なマスキング設定ルールを実現。DBのデータへの直接マスキングだけでなく、Dumpファイル、CSVやParquet、フリーテキスト(文章データ)にも対応。WebAPIによるマスキングも可能です。

FUNCTION 01文字種、文字長を維持してマスキング

ひらがな、カタカナ、漢字等のマルチバイト文字に対応。英数字、日本語、記号等が混在していても、元データと同じ文字種・文字数でデータを生成します。

  • 半角カナ、全角数字、全角アルファベット含む
  • (株)等、そのまま残したい文字列は、予約語(除外文字)として登録可能

FUNCTION 02複数のデータ間での整合性(データモデル)を維持

システムで採番されたID等のユニーク性を保ったままのマスキングが可能です。複数テーブル間での関係性(参照整合性)を崩しません。

FUNCTION 03特定箇所(セグメント)を指定してマスキング

電話番号、郵便番号、クレジットカード番号などに対して、ハイフンなどを区切り文字に選んでセグメントを指定可能。分割された文字列毎にマスキング処理の方法を設定することができます。

FUNCTION 04独自の辞書でマスキング

ユーザー作成の期待値データを格納した辞書ファイルを用意すれば、期待値データで置換が可能です。(人名を格納した辞書ファイルを準備し、氏名データを置換など)

FUNCTION 05再現性を保ったマスキング

マスキング処理を複数回行った場合、毎回同じ結果を得られるようにすることも、実施毎に異なる結果を得られるようにすることも可能です。(日々追加される業務データなどの差分データのマスキングに利用可能)

FUNCTION 06AIでフリーテキストから自動検出

メール、電話のコールログのようなフリーテキスト(文章データ)からマスキング対象に該当する単語を自動検出。チャットボット等のデータや業務システムの履歴データ、自由記述欄のテキストなどの匿名化対応が可能です。

フリーテキストのGUI設定のイメージ
※ルールベースに加え、NER(固有表現抽出)自然言語処理でテキスト解析を行います。 NER : Named Entity Recognition

Insight Maskingの対応環境

Insight Masking は OS(Oracle Linux 8)および各種ソフトウェアを組み合わせた仮想アプライアンスとして提供しています。

仮想アプライアンス VMware ESXi / AWS EC2 / Azure VM
CPU 2 vCPU 以上
メモリ 8 GB
ディスク 50 GB 以上

※ Qlik Replicateとの連携では、データソースはQlik Replicateのサポート対象に従います。 ※ 稼働環境に対する詳細情報は、お問い合わせください。

CONTACT

お問い合わせ・お見積のご希望等は
お気軽にお問い合わせフォームからお問い合わせください

デジタルプラットフォーム事業本部
エンタープライズソリューション営業部