Shopify商品CSVを翻訳した後に確認する列

Shopify商品CSVの多言語化では、翻訳対象の列が多く、一つ漏れるとストア前面にそのまま表示されてしまいます。翻訳後の確認は「どの列が翻訳済みか」「どの列は翻訳してはいけないか」を明確に分けることが最大のポイントです。本記事では、翻訳後に重点的にチェックすべき列を対象別に整理し、自動検出できる項目と人間の判断が必要な項目に分けて解説します。


翻訳対象列と非翻訳列の区別

Shopifyの商品CSVには数十列ありますが、すべてが翻訳対象ではありません。まず、列を3つのグループに分けて認識を合わせます。

翻訳対象の列

これらはストア前面や検索結果に直接表示されるテキストで、多言語化の主目的になります。

  • Title ― 商品名。顧客が最初に目にするテキストです。
  • Body (HTML) ― 商品説明文。HTMLタグを含むため、翻訳時にタグの崩れが起きやすい列です。
  • SEO title ― 検索結果に表示されるページタイトル。Title列と表記揺れが生じやすい箇所です。
  • SEO description ― 検索結果のスニペットに使われる説明文。
  • Tags ― 商品タグ。フィルターやコレクションの条件に使われます。翻訳する場合は他言語間のタグ命名規則を統一する必要があります。
  • Vendor ― ブランド名やメーカー名。翻訳するかどうかはブランド方針によります。
  • Product Category ― Shopifyの標準カテゴリ。基本はShopify定義の英語IDを維持しますが、カスタムカテゴリ名を利用している場合は翻訳対象になります。
  • Image Alt Text ― 画像の代替テキスト。アクセシビリティとSEOの両方に関わる重要な列です。
  • Option1 Name / Option1 Value など ― バリエーションのオプション名と値(色、サイズなど)。顧客が選択するラベルのため翻訳が必要です。

翻訳してはいけない列

これらはシステム識別子やコード値であり、翻訳するとデータ連携が壊れます。

  • Handle ― URLスラッグとして使われる一意識別子。翻訳すると既存URLが変わり、リンク切れやSEO評価の喪失につながります。
  • SKU ― 在庫管理コード。翻訳すると在庫システムとの照合ができなくなります。
  • Variant Barcode ― バーコード番号。数値のまま維持します。
  • Variant Grams / Variant Inventory Qty ― 数値項目。翻訳の対象外です。
  • Published ― 公開状態を表すTRUE/FALSE。変更してはいけません。
  • Image Src / Image Position ― 画像URLと表示順序。システム値です。

ケースバイケースの列

  • Metafields ― メタフィールドの内容が顧客向けテキストの場合は翻訳、内部データの場合は維持。
  • Gift Card ― ギフトカードかどうかのフラグ値なので通常は翻訳不要。
  • Google Shopping / Custom collections ― Google Merchant Center向けの列は用途に応じて翻訳を判断します。

翻訳後の確認項目まとめ

翻訳が完了したCSVに対して、どの項目をどう確認するかを一覧にします。「自動検出」とは、文字数カウントや正規表現マッチなどで機械的に見つけられる問題です。「人間確認」は、文脈を理解しないと判断できない品質の問題です。

確認対象 自動検出 人間確認 注意点
Title 未翻訳セクション、文字数超過(ショップifyでは推奨70文字以内)、言語混入 ブランド名の表記揺れ、商品のニュアンス SEO titleと同じ内容にするか別にするか方針を決めておく
Body (HTML) HTMLタグの不整合(閉じタグ漏れ、タグ名の翻訳)、画像リンクの欠落 翻訳文の自然さ、レイアウト崩れの有無 <li>内だけ翻訳されて<ul>が残るなど、部分翻訳に注意
SEO title 文字数超過(推奨60文字以内)、Title列との不一致検出 検索意図に合った見出しか Title列と同じ訳を流用すると表現の幅が狭くなる
SEO description 文字数超過(推奨160文字以内)、言語混入 訴求力のある要約になっているか 翻訳によって冗長になりがち、日本語は文字数が増える傾向
Tags 言語混入、用語の不統一(同義の異なる表記) タグ体系の整合性、コレクションフィルターへの影響 翻訳後のタグ名が既存コレクションの条件とマッチするか確認
Image Alt Text 空欄検出、文字数超過(推奨125文字以内) 画像内容を正確に表しているか SEO観点とアクセシビリティ観点の両方を満たす必要がある
Option1 Value など 未翻訳検出、用語不統一 サイズ表記のローカライズ品質(S/M/Lを維持するか、数値サイズにするか) 同じオプション値が他の商品と一致しているかも確認
Vendor 言語混入 ブランド名を翻訳するかそのままにするかの方針 ブランド名は翻訳しないことが多いが、現地法人名に差し替えるケースも
Handle / SKU 意図せぬ変更の検出(元CSVとの差分) ―(基本は人間確認不要、変更されていないことが前提) 翻訳ツールが誤って書き換える事故が多い列

自動検出で実施できるチェック

スクリプトやツールで機械的に検出できる問題を優先して潰すと、人間の確認作業が効率的になります。以下は実務で使える自動チェックの具体例です。

言語混入の検出

あるセルの中に、意図した翻訳先言語と異なる文字が混ざっていないかを検出します。たとえば日本語に翻訳した列に英語の単語がそのまま残っているケースや、逆に翻訳先の中国語が一部日本語で出力されているケースなどです。Unicode範囲を用いた正規表現で、各セルの主要言語を判定し、想定外の文字が含まれていればフラグを立てます。

未翻訳セクションの検出

Body (HTML)列はテキスト量が多いため、一部段落だけ翻訳されずに残ることがあります。原文セルと翻訳後セルを比較し、原文と同一のテキストブロックが残っていないかを確認します。HTMLタグを除去した上で比較すると精度が上がります。

HTMLタグの整合性チェック

翻訳ツールがHTMLタグ名を誤って翻訳してしまう事故は頻発します。典型的な例は<strong>が<強い>に翻訳されるケースや、<li>が訳文の中で消えるケースです。翻訳前後でタグの種類と出現数を比較し、差分があればアラートを出します。特に<a href=”…”>のリンク先URLが書き換えられていないかも確認が必要です。

文字数カウント

SEO title、SEO description、Image Alt Textには推奨文字数があります。これらを超過しているセルを抽出し、一覧化します。日本語は英語に比べて文字数が増える傾向があるため、英語版をベースに文字数上限を設けている場合は注意が必要です。

用語の不統一検出

同じ商品のTitle列とSEO title列で異なる訳語が使われていないか、複数商品間で同じ概念に異なる表記が使われていないかを検出します。たとえば「ワイヤレス」と「無線」、「イヤホン」と「イヤーパッド」のような表記揺れは、自動でリストアップできます。


人間の判断が必要な確認

自動チェックを通過した後でも、品質面で人間の目が必須な領域があります。ここを飛ばすと、顧客向けの表現として不自然になったり、法的な問題を引き起こす可能性があります。

翻訳品質と商品ニュアンス

機械翻訳は文法的に正しくても、商品の魅力を伝える表現としては弱いことがあります。たとえば「軽量で快適な装着感」というべきところが「軽くて快適」とだけ翻訳されている場合、商品の訴求力が落ちています。ブランドのトーン&マナーに合致しているかの確認は人間にしかできません。

ブランド名・製品名の取り扱い

Vendor列やTitle列に含まれるブランド名を翻訳するかどうかは、ブランドガイドラインに依存します。「Apple」を「りんご」と訳してはいけないのは極端な例ですが、「UNIQLO」を「ユニクロ」にするか「UNIQLO」のままにするかは、市場とブランド方針によって判断が分かれます。

法規制・安全文言の確認

食品、化粧品、医療機器など規制のある商品カテゴリでは、表示義務のある文言が法律で定められています。この種のテキストがBody (HTML)内に含まれている場合、翻訳の正確性は法律遵守に関わるため、該当業界の専門用語集と照合する必要があります。

サイズ・仕様のローカライズ

Option1 Value列のサイズ表記は、市場によって表記を変えることがあります。米国市場向けにS/M/Lを使うか、EU向けに36/38/40を使うかの判断は、商品の仕様とターゲット市場の慣習を考慮する必要があります。


実務での確認ワークフロー例

実際の運用で効果的だった確認の手順を紹介します。商品数が数百を超える場合は、全件を人間が目視で確認することは現実的ではないため、自動と人間の確認を段階的に組み合わせます。

  1. 元CSVのバックアップ ― 翻訳前のCSVを保管し、差分比較の基準として使います。
  2. 自動チェックの実行 ― 上記の自動検出項目をスクリプトで一括実行し、問題のあるセルをリスト化します。
  3. Handle / SKU / Barcodeの不変確認 ― 翻訳対象外列が誤って変更されていないか、元CSVとの差分で確認します。
  4. HTMLタグ整合性の確認 ― Body (HTML)列のタグ構造を検証します。
  5. サンプリングによる人間確認 ― 全商品の10〜20%をランダムに抽出し、Title、SEO title、SEO description、Image Alt Textの翻訳品質を目視で確認します。
  6. 重点商品の全件確認 ― 売上上位商品や新商品など、重要度の高い商品は全項目を人間が確認します。
  7. ステージング環境でのプレビュー ― CSVをインポートした後に、実際のストアページで表示崩れやリンク切れがないかを確認します。

よくあるトラブルと対処

翻訳後のCSVで特に頻繁に発生する問題をいくつか挙げておきます。

Body (HTML)のレイアウト崩れ

HTMLタグとテキストの間に不要なスペースが入ったり、<p>タグが消えて段落構造が崩れたりすることがあります。翻訳ツールがタグをテキストの一部として扱う場合に発生しやすい問題です。インポート後にプレビューで実際の表示を確認することが最も確実な対処法です。

Title列とSEO title列の不一致

別々に翻訳した結果、同じ商品なのにTitle列とSEO title列で異なる商品名になることがあります。方針として「TitleとSEO titleは同一にする」「SEO titleはTitleを短縮したものにする」など、ルールを決めてから翻訳に進むことで防げます。

Tags列の言語混ざり

一部のタグだけが翻訳され、残りが原文のまま残ることがあります。Tags列はカンマ区切りの一覧であるため、翻訳ツールが各タグを独立したテキストとして扱わない場合に発生します。翻訳後にタグの数が変わっていないことも併せて確認します。


相談時に用意するとよい情報

CSV翻訳の確認作業について相談される際は、以下の情報があるとスムーズです。

  • 対応する言語の数と対象言語(例:日本語、英語、中国語の3言語)
  • 商品のおおよその登録数(例:約500SKU)
  • 現在使用している翻訳ツールまたは翻訳の進め方
  • 特に気になっている列や過去に問題があった列
  • CSVの列構成(標準フォーマットか、メタフィールド等の追加列があるか)
  • 商品カテゴリ(食品、アパレル、電子機器など、規制要件の有無に関わります)

初回相談では機密CSVやスクリーンショットの送付は不要です。概要をお聞かせいただければ、確認すべき列の優先度付けや自動チェックの構成案をご提案できます。

参考にした公式情報

この記事の内容で困っている方へ

Merchant Center / 商品フィード まわりの作業整理、小さな自動化、簡易チェックツール化について相談できます。初回相談で機密CSVやスクリーンショットを送る必要はありません。

無料相談する