ブラウザで表示される「L SEP」という記号の削除方法 (Macintosh)

ブラウザで表示される「L SEP」という記号の削除方法

他のライターさんから受領した記事データを、webページ(wordpress)の記事としてに投稿をする、という作業を行なっていた時に、

確認担当者から、「こちらのブラウザでは、四角い箱に入った、不思議な記号が記事中に表示されるが、これは何?」というご指摘を受けました。

windows(Chrome)で記事を確認すると、記事の文中に、このような、四角い箱に、「L SEP」という記号が表示されていました。

以下のような記号です。

wordpressブログに表示された謎の記号 L SEP

L SEPが表示された記事は、例えば、ブラウザ上では、このような表示になります。

L SEPが表示された記事

(画面表示は、私の運営サイト「あるたびのしおり」のテスト記事です。)

文中に突然、謎の記号「L SEP」が表示されます。

L SEP

しかし、私の環境(Mac)では、この文字は表示されなかったので、したがって、私の方では、正常に投稿されているように認識をしていました。

(* 2019年7月現在のMacの、ChromeやSafariでは、この「L SEP」の表示出るようになりました。)

この記号は、何かのエラーなのでしょうか?そこで、この記号の意味と、削除方法についてを以下に記載していきます。

mac標準の文章作成ツール「Pages」で「L SEP」の表示を確認できる

その時、他のライターさんから頂いた記事データはword形式でしたが、word上ではこの記号は表示されません。

しかし、macを購入時に付属をしている、文章作成ツール「Pages」で、この記号を確認することが出来ました

wordデータを、右クリックし、開くアプリケーションに「Pages」を指定してそのまま開きます。

(もしくは、「Pages」で空白のページを新規作成し、wordの記事データをそのまま「Pages」にコピペします。)

そして、画面上部の「表示」メニューで「表示」>「不可視文字を表示」と選択します。

こうすると、改行コードなどの不可視文字が、以下のように青い記号として表示されます。

「pages」でのLSEPの表示の確認をする

「L SEP」が挿入されている部分の改行コードが異なっているのが分かります。

L SEPが挿入された部分の改行コードが異なっているのが分かる。

この改行コードは、通常のReturnでの改行ではなく、Shift + Returnで改行をした時に挿入されます

Pagesのツールバーにある「挿入」から、行区切りを選択することでも入力をすることができます。

Pages内で、行区切りを入れる

すると、改行コードが行区切りとして挿入され、この文章が、ブラウザでは「L SEP」として表示ことが分かりました。

(Pagesで表示される改行コードなどの不可視文字の意味については、以下のサイトに説明がされています。)

MacのためのPages: Pages 書類のフォーマット記号とレイアウトを表示する|Apple Support

使用環境やブラウザによっては、この記号は表示されない場合もあるので、一次チェックではOKでも、別の環境ではNGとなってしまうことがあるので、要注意です。Chrome等の特定環境のブラウザでこの行区切りが使用された記事を表示すると、「L SEP」記号として表示されてしまうようです。

L SEPという記号とは何?

調べてみたところ、これは、L SEP = Line Separator(行区切り文字)であることを示す記号であるようです。

通常は、この「行区切り文字」は、見出しの文中や、箇条書きのリストの中で、前の行とは、構造やスタイルを変えずに、見た目の改行だけを行う時に使用します。

L SEPは、通常の改行と同じく、通常は見えない文字でありながら、文章作成ツール内では機能を持つ記号のようですが、webサイト上では意味や機能を持ちません。それが、特定のブラウザ環境では、謎の四角い箱の記号として表示されてしまうようです。

web上では不要な改行コード「L SEP」を削除する方法は?

「L SEP」を削除する為に、私は2種類の方法で対応する事にしました。(両方ともmacでの対応方法となります。)

方法1 macの文章作成ツール「Pages」で、不可視文字を確認して削除する。

word形式など受け取った記事データを、「Pages」で開きます。もしくは、「Pages」の新規書類ページ上に記事を丸ごとコピペします。

上記の、「Pages」ツールでのLSEPの表示方法により、「L SEP」を表示します。

「L SEP」は、その行区切りの後にカーソルを当て、deleteすることで、一つ一つ手作業で削除することができます。

地道な方法ですが、文章量が少ない場合は手っ取り早い方法です。

方法2 macOS 用 日本語テキストエディタ「mi」で「L SEP」部分を確認し、一括削除する。

Pagesを使用する方法で、困る点は、この不可視文字を検索して一括処理することが出来ないことです。

大量の文章を扱う際に、何か良い方法はないか?と、この「L SEP」を確認・検索する機能を持つエディタを見つけました。

フリーウエアとして配布されている、「mi」(https://www.mimikaki.net/)というmac用のテキストエディタです。

このエディタでは、「L SEP」部分の確認と、正規表現での一括検索と削除を行うことができます。

テキストエディタ「mi」で「L SEP」を確認する。

テキストエディタ「mi」で、記事を開きます。文字コードは、「UTF-8」です。

ツールバーの左から2番目のアイコン「サブウインドウ」をクリックし、「テキスト情報」を表示します。

「L SEP」の含まれている部分の前に、カーソルを当てます。

すると、「テキスト情報」に、「現在の文字:U+2028」と表示されます。

以下のような画面となります。

テキストエディタ「mi」でL SEPを確認する

「U+2028」と表示される部分が、Unicode文字の「L SEP」となります。

ここで、カーソルを一文字先に送り(カーソル自体は動きません。)deleteキーを押すことで、「L SEP」部分を削除することもできます。

テキストエディタ「mi」で「L SEP」部分を一括削除する。

1.画面上部の「検索」メニューで「検索」>「検索/置換ダイアログを表示」と選択します。すると、以下の図のようなダイアログが現れます。

2.「検索オプション」で、「正規表現検索」にチェックを入れます。

「mi」の検索・置換ダイアログを使用する

3.検索欄に「\u2028」と入力をして、「一覧」を選択します。すると、「L SEP」の入っている行が、「検索結果」に一覧表示されます。

以下のような表示です。

検索・置換ダイアログでLSEP部分を一覧表示をする

4.次に、置換欄に仮の文字、例えば「AAAAA」と入力して、範囲を「すべて」として、「次を置換」をクリックすると、「L SEP」の文字が、いったん「AAAAA」に一括変換されます。

5.変換されたことを確認したら、今度は、検索欄を「AAAAA」とし、置換欄を空欄として、「次を置換」をクリックすると、「L SEP」が一括削除されます。

「L SEP」ではなく、「P SEP」という段落区切り文字や、ただの四角い箱が表示される場合

同様の現象は、「L SEP」以外のUnicodeの不可視文字でも再現されるようです。

その際には、「mi」の方法で、

「P SEP」 (Paragraph Separator) → 「\u2029」
「四角い箱(NEL)」 (Next Line) → 「\u0085」で検索をすれば対応できるのではないかと思います。(未検証です。)

毎回確認が必要であれば、テキストエディタ「mi」の「検索メモリー」に、検索文字を登録をしておくと作業がしやすいです。