幅なし空白文字ノーブレークスペースとJavaScriptのString length [JavaScript]

2022年3月22日 2024年11月21日

とあるサービスを利用した時、日本語文字列の文字数が、想定より多く取得される現象に遭遇しました。

JavaScriptのString lengthはStringオブジェクトの文字列長をUTF-16コードユニットの数で表しているため、lengthで返される値が文字列の実際の文字数と一致しなくなる可能性があります。

とは言えただのlengthを打って、目に見えている文字数と明らかに乖離した結果が返ってくるのは焦ります。

どうなっているのか確認するためChromeの開発者モードで対象のvalue値を確認したところ「」が挿入されていたわけです。

これは幅なしの空白文字（ノーブレークスペース、ゼロ幅スペース）と呼ばれるもので、サーバーサイドで特殊文字対策(サニタイジング)してないのか？と思いましたが、他人のサービスのためカスタマイズできないので、JavaScript側でトリムすることになりました。

とりあえず下記で行けますが、ブログサイトの表記やweb上の実行サイトなどで使うと、が表現されないため遭遇したら自分の環境で試してください。

var str_result = "対象文字列".replace(/[\u200B-\u200D\uFEFF]/g, '');

//ターゲット文字列
var tar_char = "おもてなし";
//そのまま実行
console.log(tar_char.length); //9 おもてなし
//空白をトリムして実行
var str_result  = tar_char.replace(/[\u200B-\u200D\uFEFF]/g, '');
console.log(tar_char.length); //5 おもてなし

幅がないスペースは下記が該当します。

U + 200B
U + 200C
U + 200D
U + FEFF

https://stackoverflow.com/questions/18478847/why-is-8203-being-injected-into-my-html

今日の一杯

今日の一杯日本酒

2025/9/1

純米酒天領レビュー｜今日の一杯日本酒

岐阜県・飛騨高山の老舗酒蔵「天領酒造」の純米酒。飛騨地方は江戸時代に幕府の直轄地(天領)とされていた土地です。この「天領」という名前、ピンときた方もいるのでは？そう、かつてゲームボーイで発売された『メダロット2』の主人公、「天領イッキ」の由来になっているお酒です。どんなお酒？今回飲んだのは、天領酒造さんの定番純米酒。岐阜のブランド米「ひだほまれ」を使用し、軟水仕込みで丁寧に造られた一本です。味わい：ほんのりとした米の甘みと、すっきりとした後味が特徴。冷やしても良いけれど、ぬる燗（42℃前後）で ...

今日の一杯赤ワイン

2025/7/7

フェウド・アランチョネロ・ダーヴォラレビュー｜今日の一杯赤ワイン

「フェウド・アランチョネロ・ダーヴォラ」は、味わい深く、コスパの良い、安定した品質の一本です。トマト系の煮込み料理や、チーズをたっぷりのせたラザニアとも合い、もちろん、静かな夜にひとりでグラスを傾ける時間にもぴったり。海外の専門家たちからも高評価を得ており、日常使いからしっかりした食事まで汎用的に活躍します。味と風味口に含むと、熟したダークベリーやラズベリーの果実味が広がりながら、後半にかけてほんのりドライハーブのような余韻が続きます。酸味は控えめで、タンニンはしっかりしています。飲みごたえ ...

エナジードリンク今日の一杯

2025/6/30

ZONe ENERGY ABSOLUTE VICTORY 勝レビュー｜今日の一杯エナジードリンク

ZONe ABSOLUTE VICTORYは2025年1月に発売されたエナジードリンクです。受験勉強をイメージしたデザインの商品で、学問の神様として知られる菅原道真公を祀る太宰府天満宮に「HYPER ZONe 」を奉納し、受験生の合格を祈願しているそうです。寒い冬に体を温めるように、成分にジンジャーシロップが配合されており、堅調に生姜の味がします。カナダドライのジンジャーエールとはまた違う、比較的マイルドな飲みやすい生姜ジュースといった印象です。 ZONeの1本あたりのカフェイン量は75mgとコーヒ ...

九十九史恩

キーを叩いていないときは、都会や田舎の風景を探検しています。

よく読まれている記事

1: 条件の0=0は全てが正であるを意味する [SQL]

SQLの条件に0=0のような記述を見かけます。変わった書き方の条件ですが、これは「全てが正である」事を意味しており、結合条件の場合はCROSS JOINと同じです。下記の例で言えば、結合するsub ...

2: DISTINCTを使わないで重複排除を考える [SQL]

SQLのDISTINCTはEXISTSとかGROUP BYでなんとかする事もできます。 DISTINCTは暗黙的なソートがされますが、何のDBを使うにせよ過去のバージョンならともかく、最近のバージョン ...

3: RFC 5322に準拠させた正規表現言語別

RFC5322で定義されている正規表現を、各言語の正規表現に変化させた形になります。完全な電子メール正規表現は存在しないので、結局のところ何かの公式基準に従っていたとしても、自分が携わるサービスのル ...

-JavaScript

JavaScript

2022/3/22

すべてのJavaScript開発者が知っておくべき8つの文字列メソッド

JavaScriptの文字列操作で忘れず知っておきたい文字列関数一覧。 1.indexOf() indexOf()メソッドは、その名の通り、文字列の中で指定した値が最初に出現するインデックスを返します。下の例だと、strの文字列の中で最初に「Sparsh」が出現するのはインデックス12なので12を返却します。インデックス数なので0から始まります。 let str = "Hey This Is Sparsh Gupta, The guy Behind Sparsh Codes"; console.log( ...

JavaScript

2022/3/22

知っておきたいJavaScriptのコールバック関数について

JavaScriptの非同期処理の利用を考えるとき、大なり小なり処理の完了や失敗を確認する必要があるはずです。そんな時に必要になるのがCallback(コールバック)処理です。 JavaScriptのコールバック関数とは、簡単に言えば、他の関数にパラメータとして関数を渡し、他の関数の中で呼び出されたり、実行されたりする関数のことです。 const onFollowSuccess = (username) => { console.log(`You Followed ${username} !`); ...

JavaScript

2023/7/26

javascriptで変数の存在判定｜undefinedの判定処理

undefinedの判定は変数をどのように考えるかで判定方法が異なります。変数自体が定義されていないかを判定する場合は「typeof x === 'undefined'」です。この書き方は変数の存在自体を確認するものです。存在以外の判定が出来ないから良くないと書かれますが、それは個別にやるべきことです。「x === undefined」この書き方は、評価された変数が存在するかを判定するものであり、変数自体が定義されてないと、ReferenceErrorが発生するのでコンソールエラーが発生して処理が ...

JavaScript

2025/7/7

右クリック禁止・コピー禁止を解除するjavascriptの仕組みと簡潔化

いくつかのウェブサイトでは、右クリックやテキストの選択・コピーを禁止するJavaScriptが使われています。例えば、「この記事の内容を転載しないでください」などの理由で、右クリックメニューが無効になっていたり、文字列を選択できないようにされていることがあります。この記事では、そうした制限を自己責任で一時的に解除するためのBookmarklet（ブックマークレット）をご紹介します。右クリックおよび選択禁止の解除 javascript:(()=>{const p=e=>e.stopProp ...

JavaScript

2023/4/5

ブクログの本棚を埋め込む方法

ブクログの本棚を埋め込めるブログパーツの提供は2019年5月17日に終了しました。しかし、現在も埋め込み機能を利用しているブログが多数あるためAPIは提供されています。そのため、ブログパーツAPIを呼び出すことで本棚を表示する事ができます。 xxxxxにブクログのユーザーIDを入力し、yyyyyにカテゴリー番号を記載します。カテゴリー番号が必要なので、事前にブクログ側でカテゴリーを作成しておき、各種本を紐付けておきましょう。 <script type="text/javascript" src ...

フォントファイルの軽量化

繰り返し処理を使って要素を消す [JavaScript]