この度、日本のお客様の要望を受け、ストレージコンポーネント(SFTP, S3, Google Cloud Storage,Azure Blob Storage)で日本語ファイルのサポート機能を強化しました。

  • エンコーディングオプションとしてWindows-31Jを追加
  • ファイル保存時の改行コードに「CRLF」を追加
  • エスケープキャラクターの指定が可能

このブログでは、今回追加された上記の機能について紹介します。

Table of Contents:

エンコーディングオプション:Windows-31J

改行コードの指定

エスケープキャラクターの指定

最後に

エンコーディングオプション:Windows-31J

Integrate.ioではすでに2020年1月にShift-JISでエンコーディングされたCSV,TSVファイルに対応していましたが、今回の対応により、Shift_JISを拡張した文字コードである「Windows-31J」が追加されました。これにより、Shift-JISでは文字化けするような拡張文字である「①」、「㈱」などの文字を含むテキストファイルについても対応できるようになりました。

ストレージのSource コンポーネントおよびDestinationコンポーネントで、以下のように設定可能です。

Source コンポーネント

Source actionで「Copy, merge and process all files」もしくは「Process only new files (Incremental load)」を選択し、Character encodingのリストボックスで「Windows-31J 」を選択します。

thumbnail image

Destination コンポーネント

Destination actionで「Use intermediate storage and copy files to an existing directory in destination」を選択し、Character encodingのリストボックスで「Windows-31J」を選択します。

thumbnail image

改行コードの指定

Destination コンポーネント

Destinationコンポーネントでファイル保存時の改行コードの指定が可能になりました。これにより、LFに加えて、CRLFでの保存が可能になりました。

thumbnail image

エスケープキャラクターの指定

Source/Destinationコンポーネント

thumbnail image

最後に

Integrate.ioでは今後も日本のお客様の要望にお応えし、必要な機能を随時追加していく予定です。もし、今回追加された機能を使って、実際にデータパイプラインを作成してみたいという方は、ぜひオンラインデモにお申し込みいただき、トライアルで実際に触ってみてください。