
Insight Masking
大規模言語モデルを活用した、個人情報を
速く・正確に匿名化するデータマスキングソフトウェア
個人情報などの機密情報をマスキングで匿名化。
非本番環境へのデータコピー、環境移行のテスト、データ分析などの場面で、
情報漏洩のリスクを低減する。
Insight Masking
大規模言語モデルを活用した、個人情報を
速く・正確に匿名化するデータマスキングソフトウェア
個人情報などの機密情報をマスキングで匿名化。
非本番環境へのデータコピー、環境移行のテスト、データ分析などの場面で、
情報漏洩のリスクを低減する。
データのユニーク性、参照性・整合性などデータの論理的特性をそのままにマスキング。
データの種類・分布などのデータの統計的特性も維持したままのテストデータを生成します。
不十分なデータでのテストによる不具合の防止や短期間でのデータ準備、性能評価に利用可能なテストデータとして、開発サイクルの効率化に貢献します。
データ持ち出し時にセキュリティを担保しながら機能面のテストや性能評価を行うことができ、クラウド移行準備の工数削減に貢献します。
個人情報を含むデータのマスキング、更にマスキングデータ作成フローの自動化により、セキュリティリスクを抑止。
ビジネスユーザーが利用できる分析用データを作成できます。
サマリー
自社開発の高性能AIエンジンで日本語(ひらがな、カタカナ、漢字)に最適化。
英数字や記号など文字種を判別して、ファイルやデータベースのカラム・文章データから個人情報を自動抽出します。
ユーザーが独自ルールを定義することで、より細かな抽出が可能になります。
不十分なデータでのテストによる不具合の防止や短期間でのデータ準備、性能評価に利用可能なテストデータとして、開発サイクルの効率化に貢献します。
実データを解析して、匿名化対象の個人情報・機密情報を検出。該当データのカラムに自動でラベル付けが行われます。
Insight Maskingはデータ加工処理のパラレル化により、これまで大量のマスキング処理にかかっていた膨大な時間を劇的に圧縮。データマスキングに必要な工数を削減します。
日本語に最適化された高性能AIエンジンにより、匿名化候補文字列の自動検出と自然な変換で豊富なマスキング設定ルールを実現。DBのデータへの直接マスキングだけでなく、Dumpファイル、CSVやParquet、フリーテキスト(文章データ)にも対応。WebAPIによるマスキングも可能です。
ひらがな、カタカナ、漢字等のマルチバイト文字に対応。英数字、日本語、記号等が混在していても、元データと同じ文字種・文字数でデータを生成します。
システムで採番されたID等のユニーク性を保ったままのマスキングが可能です。複数テーブル間での関係性(参照整合性)を崩しません。
電話番号、郵便番号、クレジットカード番号などに対して、ハイフンなどを区切り文字に選んでセグメントを指定可能。分割された文字列毎にマスキング処理の方法を設定することができます。
ユーザー作成の期待値データを格納した辞書ファイルを用意すれば、期待値データで置換が可能です。(人名を格納した辞書ファイルを準備し、氏名データを置換など)
マスキング処理を複数回行った場合、毎回同じ結果を得られるようにすることも、実施毎に異なる結果を得られるようにすることも可能です。(日々追加される業務データなどの差分データのマスキングに利用可能)
メール、電話のコールログのようなフリーテキスト(文章データ)からマスキング対象に該当する単語を自動検出。チャットボット等のデータや業務システムの履歴データ、自由記述欄のテキストなどの匿名化対応が可能です。
フリーテキストのGUI設定のイメージ
※ルールベースに加え、NER(固有表現抽出)自然言語処理でテキスト解析を行います。 NER : Named Entity Recognition
Insight Masking は OS(Oracle Linux 8)および各種ソフトウェアを組み合わせた仮想アプライアンスとして提供しています。
仮想アプライアンス | VMware ESXi / AWS EC2 / Azure VM |
---|---|
CPU | 2 vCPU 以上 |
メモリ | 8 GB |
ディスク | 50 GB 以上 |
※ Qlik Replicateとの連携では、データソースはQlik Replicateのサポート対象に従います。 ※ 稼働環境に対する詳細情報は、お問い合わせください。