aboutsummaryrefslogtreecommitdiffhomepage
path: root/content/posts/2022-11-19
diff options
context:
space:
mode:
authornsfisis <nsfisis@gmail.com>2023-03-20 22:03:50 +0900
committernsfisis <nsfisis@gmail.com>2023-03-20 22:03:53 +0900
commitf7ae224f3e2530bb4b05166b6013f8a42432086e (patch)
tree32f45300baddc4a8cd4f05382e18a59d6f82ecdb /content/posts/2022-11-19
parent627330f7e80e2eac0f92663bbdaaf39962e97bbe (diff)
downloadblog.nsfisis.dev-f7ae224f3e2530bb4b05166b6013f8a42432086e.tar.gz
blog.nsfisis.dev-f7ae224f3e2530bb4b05166b6013f8a42432086e.tar.zst
blog.nsfisis.dev-f7ae224f3e2530bb4b05166b6013f8a42432086e.zip
feat(nuldoc): rename simpara to para
See also: https://tdg.docbook.org/tdg/sdocbook/5.1/para.html
Diffstat (limited to 'content/posts/2022-11-19')
-rw-r--r--content/posts/2022-11-19/phperkaigi-2023-unused-token-quiz-2.xml88
1 files changed, 44 insertions, 44 deletions
diff --git a/content/posts/2022-11-19/phperkaigi-2023-unused-token-quiz-2.xml b/content/posts/2022-11-19/phperkaigi-2023-unused-token-quiz-2.xml
index b02cb14..0332179 100644
--- a/content/posts/2022-11-19/phperkaigi-2023-unused-token-quiz-2.xml
+++ b/content/posts/2022-11-19/phperkaigi-2023-unused-token-quiz-2.xml
@@ -18,28 +18,28 @@
</info>
<section xml:id="intro">
<title>はじめに</title>
- <simpara>
+ <para>
2023 年 3 月 23 日から 25 日にかけて開催予定 (記事執筆時点) の <link xl:href="https://phperkaigi.jp/2023/">PHPerKaigi 2023</link> において、
昨年と同様に、弊社 <link xl:href="https://www.dgcircus.com/">デジタルサーカス株式会社</link> からトークン問題を出題予定である。
- </simpara>
- <simpara>
+ </para>
+ <para>
昨年のトークン問題の記事はこちら: <link xl:href="/posts/2022-04-09/phperkaigi-2022-tokens/">PHPerKaigi 2022 トークン問題の解説</link>
- </simpara>
- <simpara>
+ </para>
+ <para>
すでに 2023 年用の問題は作成済みであるが、その制作過程の中でいくつかボツ問ができた。せっかくなので、PHPerKaigi 開催を待つ間に紹介しようと思う。
- </simpara>
- <simpara>
+ </para>
+ <para>
10 月から 2 月まで、毎月 1 記事ずつ公開していく予定 (忘れていなければ)。
- </simpara>
- <simpara>
+ </para>
+ <para>
その 1 はこちら: <link xl:href="/posts/2022-10-23/phperkaigi-2023-unused-token-quiz-1/">PHPerKaigi 2023: ボツになったトークン問題 その 1</link>
- </simpara>
+ </para>
</section>
<section xml:id="quiz">
<title>問題</title>
- <simpara>
+ <para>
注意: これはボツ問なので、得られたトークンを PHPerKaigi で入力してもポイントにはならない。
- </simpara>
+ </para>
<programlisting language="php" linenumbering="unnumbered">
<![CDATA[
<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s='​<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s=%s)."\n","\x27$s\x27");?>')."\n","\x27$s\x27");?>
@@ -54,15 +54,15 @@
<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s='​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s=%s)."\n","\x27$s\x27");?>')."\n","\x27$s\x27");?>
]]>
</programlisting>
- <simpara>
+ <para>
"And Then There Were None" (そして誰もいなくなった) と名付けた作品。変則 quine (自分自身と同じソースコードを出力するプログラム) になっている。
- </simpara>
+ </para>
</section>
<section xml:id="how-to-obtain-token">
<title>トークン入手方法</title>
- <simpara>
+ <para>
実行してみると、次のような出力が得られる。
- </simpara>
+ </para>
<programlisting language="php" linenumbering="unnumbered">
<![CDATA[
#
@@ -77,9 +77,9 @@
<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s='​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s=%s)."\n","\x27$s\x27");?>')."\n","\x27$s\x27");?>
]]>
</programlisting>
- <simpara>
+ <para>
1 行目を除き、先ほどのコードとほぼ同じものが出てきた。もう一度実行してみる。
- </simpara>
+ </para>
<programlisting language="php" linenumbering="unnumbered">
<![CDATA[
#
@@ -94,9 +94,9 @@
<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s='​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​<?php printf((isset($s)?fn($s)=>trim($s,"​"):fn($s)=>chr(strlen($s)/3))($s=%s)."\n","\x27$s\x27");?>')."\n","\x27$s\x27");?>
]]>
</programlisting>
- <simpara>
+ <para>
今度は 2 行目が書き換えられた。すべての行が変化するまで繰り返すと次のようになる。
- </simpara>
+ </para>
<programlisting language="php" linenumbering="unnumbered">
<![CDATA[
#
@@ -111,64 +111,64 @@
P
]]>
</programlisting>
- <simpara>
+ <para>
トークン「#WELOVEPHP」が手に入った。
- </simpara>
+ </para>
</section>
<section xml:id="commentary">
<title>解説</title>
- <simpara>
+ <para>
一見すると同じ行が 10 行並んでいるだけなのにも関わらず、なぜそれぞれの行で出力が変わるのか。ソースコードをコピーして、適当なエディタに貼り付けるとわかりやすい。
- </simpara>
- <simpara>
+ </para>
+ <para>
Vim で開くと次のようになる (1 行目を抜粋)。
- </simpara>
+ </para>
<programlisting language="php" linenumbering="unnumbered">
<![CDATA[
<?php printf((isset($s)?fn($s)=>trim($s,"<200b>"):fn($s)=>chr(strlen($s)/3))($s='<200b><?php printf((isset($s)?fn($s)=>trim($s,"<200b>"):fn($s)=>chr(strlen($s)/3))($s=%s)."\n","\x27$s\x27");?>')."\n","\x27$s\x27");?>
]]>
</programlisting>
- <simpara>
+ <para>
<literal>&lt;200b&gt;</literal> と表示されているのは、Unicode の U+200b で、ゼロ幅スペースである。
- </simpara>
+ </para>
<note>
- <simpara>
+ <para>
エディタによっては、ゼロ幅スペースが見えないことがある。VSCode ではブラウザと同様に不可視だった。
- </simpara>
+ </para>
</note>
- <simpara>
+ <para>
文字列リテラルの中にゼロ幅スペースを仕込むことで、見た目を変えずに情報をエンコードすることが可能となる。
- </simpara>
- <simpara>
+ </para>
+ <para>
続いて、トークンへの変換ロジックを解析する。注目すべきはこの部分だ。以下、ゼロ幅スペースは Vim での表示に合わせて <literal>&lt;200b&gt;</literal> と記載する。
- </simpara>
+ </para>
<programlisting language="php" linenumbering="unnumbered">
<![CDATA[
fn($s)=>chr(strlen($s)/3)
]]>
</programlisting>
- <simpara>
+ <para>
PHP の <literal>strlen()</literal> は文字列のバイト数を返す。1 行目の <literal>$s</literal> は以下の内容となっており、
- </simpara>
+ </para>
<programlisting language="php" linenumbering="unnumbered">
<![CDATA[
$s='<200b><?php printf((isset($s)?fn($s)=>trim($s,"<200b>"):fn($s)=>chr(strlen($s)/3))($s=%s)."\n","\x27$s\x27");?>'
]]>
</programlisting>
- <simpara>
+ <para>
このソースコードは UTF-8 で書かれているので、105 バイトになる。それを 3 で割ると 35 となり、これは <literal>#</literal> の ASCII コードと一致する。他の行も、同様にしてゼロ幅スペースを詰めることで文字列長を調整し、トークンをエンコードしている。
- </simpara>
- <simpara>
+ </para>
+ <para>
デコード部以外の部分は、quine のための記述である。
- </simpara>
+ </para>
</section>
<section xml:id="outro">
<title>おわりに</title>
- <simpara>
+ <para>
<link xl:href="https://blog.rust-lang.org/2021/11/01/cve-2021-42574.html">CVE-2021-42574</link> に着想を得た作品。この脆弱性は、Unicode の制御文字である left-to-right mark と right-to-left mark を利用し、ソースコードの実際の内容を欺く、というもの。簡単のためゼロ幅スペースを用いることとし、ついでに quine にもするとこうなった。
- </simpara>
- <simpara>
+ </para>
+ <para>
ボツになった理由は、ゼロ幅スペースを表示してくるエディタが想像以上に多かったため。「同じ行が並んでいるだけなのに出力が異なる」というアイデアの根幹を崩されてしまうので、この問題は不採用となった。
- </simpara>
+ </para>
</section>
</article>