-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathkanji.html
539 lines (539 loc) · 43.4 KB
/
kanji.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
<!DOCTYPE html>
<html lang="en">
<head>
<title>ソクタイプによる漢字処理法 Sokutaipu Kanji Input Method</title>
<meta charset="UTF-8" />
<meta
property="og:title"
content="ソクタイプによる漢字処理法 Sokutaipu Kanji Input Method"
/>
<meta
property="og:description"
content="Article on entering kanji with the Sokutaipu theory"
/>
<link rel="preconnect" href="https://fonts.googleapis.com" />
<link rel="preconnect" href="https://fonts.gstatic.com" crossorigin />
<link
href="https://fonts.googleapis.com/css2?family=Inter:wght@400;700&family=Noto+Sans+JP:wght@400;700&family=M+PLUS+Rounded+1c:wght@400;700&family=Azeret+Mono:wght@400;700&family=JetBrains+Mono:wght@400;700&display=swap"
rel="stylesheet"
/>
<link rel="stylesheet" href="style.css" type="text/css" />
</head>
<body class="narrow-ja">
<section>
<div lang="ja">
<h1>ソクタイプによる漢字処理法</h1>
<header>佐伯 功介*</header>
<footer>
<ul>
<li>裁判所書記官研究所講師、(社)日本ローマ字会理事、ソクタイプ研究所長</li>
</ul>
</footer>
</div>
<div lang="en">
<h1>Sokutaipu Kanji Input Method</h1>
<header>
by Saeki Kōsuke*<br />
<i>transcribed by Jennifer Chan and Sammi de Guzman</i>
</header>
<footer>
<ul>
<li>
Lecturer, Court Clerk Research Institute<br>
Director, Japan Romaji Society<br>
Director, Sokutaipu Research Institute
</li>
</ul>
</footer>
<div class="note">
<b>Note</b>: The contents of this page have been transcribed from a poor-quality PDF scan of the article. Contents may not be completely accurate.
</div>
</div>
</section>
<section>
<div lang="ja">
<h3>見出し</h3>
<ol class="contents">
<li><a href="#foreword">まえがき</a></li>
<li><a href="#background">ソクタイプ速記の現状</a></li>
<li><a href="#keyboard-layout">機械の構造</a></li>
<li>速記記号のあらまし
<ol>
<li><a href="#theory-basics">基本</a></li>
<li><a href="#briefs">略語</a></li>
<li><a href="#briefs-proportion">略語の数と割合</a></li>
</ol>
</li>
<li>漢字入力への応用
<ol>
<li><a href="#kanji-designation">漢字指定</a></li>
<li><a href="#kanji-code">漢字コード</a></li>
</ol>
</li>
<li>熟語本位への切り換え
<ol>
<li><a href="#words-over-letters">文字よりも単語</a></li>
<li><a href="#homophones">同音語の処理</a></li>
</ol>
</li>
<li><a href="#conclusion">むすび</a></li>
</ol>
</div>
<div lang="en">
<h3>Contents</h3>
<ol class="contents">
<li><a href="#foreword">Foreword</a></li>
<li><a href="#background">Current State of Sokutaipu</a></li>
<li><a href="#keyboard-layout">Keyboard Layout</a></li>
<li>Shorthand Theory
<ol>
<li><a href="#theory-basics">Basics</a></li>
<li><a href="#briefs">Briefs</a></li>
<li><a href="#briefs-proportion">Proportion of Briefs</a></li>
</ol>
</li>
<li>Kanji Input Approaches
<ol>
<li><a href="#kanji-designation">Kanji Assignments</a></li>
<li><a href="#kanji-code">Kanji Coding</a></li>
</ol>
</li>
<li>Handling Complex Expressions
<ol>
<li><a href="#words-over-letters">Words over Letters</a></li>
<li><a href="#homophones">Homophones</a></li>
</ol>
</li>
<li><a href="#conclusion">Conclusion</a></li>
</ol>
</div>
</section>
<section id="foreword">
<div lang="ja">
<h2>1 まえがき</h2>
<p>
漢字かな文を機械で処理する方法は、近年、分速何千字何万字という、高速度のものが開発されつつあるが、こういう機械の入力はほとんどが漢字テレタイプ式のさん孔テープによっている。现在の漢テレさん孔速度は、せいぜい每分70字だから釣合が取れない。
</p>
<p>
筆者は昨年、ソクタイプによる漢字入力法を発表したが、これはほんのアウトラインだったので、多数のお問い合わせをうけた。今回もページの制限があるから充分ではないが、少し詳しく述べる。
</p>
</div>
<div lang="en">
<h2>1 Foreword</h2>
<p>In recent years, high-speed methods have been developed to input kanji and kana sentences by machine, capable of processing thousands of characters a minute, but most of the input for these machines is done using Kanji teletype-style perforated tape. The current reading speed for Kanji teletype is up to 70 characters per minute, which is suboptimal.</p>
<p>Last year, I published a method for entering kanji using Sokutaipu, but since it was only a summary, I received many questions. Due to page limitations, I won't be able to give enough information this time either, but I will go into a bit more detail.</p>
</div>
</section>
<section id="background">
<div lang="ja">
<h2>2 ソクタイプ速記の現状</h2>
<p>
ソクタイプというのは、現在全国の裁判所で使っている速記の機械である。このソクタイプは、もともと第1次大戦のベレサイユ会議などで使われていたフランスの発明品を、故田中舘愛橘博士が日本に紹介したものであった。日本語を打つためのキー構成や記号、略語の組織を作って、今日の機械を完成させたのは、ソクタイプ研究所の川上 晃氏である。裁判所では昭和25年から速記官の養成を始め、20年間で卒業生1000人を超えた。
</p>
<p>
速記官の養成は2箇年の研修であるが、最初の半年で打ち方は全部覚える。しかし、この時点ではせいぜい每分70〜80語ぐらいの速さで、速記にはならない。
</p>
<p>
70語とか80語とかいうのはローマ字で書いた文章の語数である。漢字かなで書くと、統計的に1語が2字に当たる。80語が160字である。生徒の力をはなるテストは、それぞれの速さで5分間読み上げ、誤り語数2%以内を合格としている。
</p>
<p>
打ち方をおぼえたあとは反復練習しかない。80語に合格すれば90語、つぎは100語と10語ずつ速めて、1年の終わりには130〜140語に達するのが普通である。卒業資格は170語であるが、事実上全員180語以上、そのうち約半数のものが200語以上をとって出る。
</p>
<p>
いままでの最高は235語(每分470字)である。もうこの辺になると、人間がどんな速さで読めるか、試験官のほうがテストされているような形になる。
</p>
<p>
実務には150〜160語ぐらい確実にとれれば充分とされる(ラジオのニュース解説ぐらいの速さ)。瞬間的には200語以上もでるが、200語で10秒も続くことは実際にはおこらない。
</p>
</div>
<div lang="en">
<h2>2 Current State of Sokutaipu</h2>
<p>Sokutaipu is a shorthand machine currently used in courts across the country. It was originally a French invention, used at the Versailles conference at the end of World War I, and was introduced to Japan by the late Dr. Tanakadate Aitachi. It was Mr. Kawakami Akira of the Sokutaipu Research Institute who created the system of keys, symbols, and abbreviations for writing Japanese and brought the machine to its current form. The court system began training stenographers in 1950, and over 1,000 people have graduated in the past 20 years.</p>
<p>Becoming a stenographer requires two years of training, but you will learn all of the ways to write in the first six months. However, writing speed is about 70 to 80 words per minute at this point, and it cannot be used as a shorthand system.</p>
<p>The "70 or 80 wpm" figure above is the number of words in a sentence written in Romaji. When written in kanji and kana, statistically, one word corresponds to roughly two characters, so 80 words is about 160 characters. The test requires students to read out loud for 5 minutes at each speed, with a passing score of 2% or fewer incorrect words.</p>
<p>Once you have learned how to write, all you have to do is practice repeatedly. If you pass the 80 wpm test, you can improve to 90 wpm, then 100 wpm, then reach 130 to 140 wpm by the end of the year. The graduation speed requirement is 170 wpm, but virtually all of them have reached 180 wpm or more, and about half of them are at 200 wpm or more.</p>
<p>The speed record is 235 words per minute (470 characters per minute). At this point, it's as if the examiner is being tested to see how fast a person can read.</p>
<p>For practical purposes, being able to reliably capture 150 to 160 words per minute, about as fast as a radio news commentary, is considered sufficient. You can speak at more than 200 wpm in an instant, but 200 wpm lasting more than 10 seconds doesn't actually happen.</p>
</div>
<div>
<img src="layout.png" alt="Sokutaipu layout" />
</div>
<div lang="ja">
<caption>
図1 ソクタイプのキーボード
</caption>
</div>
<div lang="en">
<caption>
Figure 1: Sokutaipu keyboard.
</caption>
</div>
</section>
<section id="keyboard-layout">
<div lang="ja">
<h2>3 機械の構造</h2>
<p>
機械は、21の活字が一列に並び、それぞれ連結したキーを押すと、約2㎜突出してその場所で印字する。タイプライタとちがって、同時にいくつでもキーを押してよく、それが1行に並んで印字される。紙は6㎝幅で、60mの長さのものをジグザグに折って内臓してある。この6㎝幅の中に21文字が並ぶ。1字打っても20字打っても、1度打って手を離せば1行送る。
</p>
<p>
活字はそれぞれ個有位置で印字し、横には動かないから、つまり21孔のさん孔テープと同等である。ことばへの関連づけと、人間が目で見て読むために文字になっているが、機械の中では黒丸でも孔でもよい。たとえば
</p>
</div>
<div lang="en">
<h2>3 Keyboard Layout</h2>
<p>The machine has 21 type bars connected in a row, and when you press a key connected to each type bar, they stick out about 2 mm and print at that location. Unlike a typewriter, you can press any number of keys at the same time, and the corresponding letters will be printed in one line. The paper tape is 6 cm wide and 60 m long, folded in a zigzag pattern and placed inside the machine. There are 21 characters lined up within this 6 cm width; whether you write one key or 20, if you press once and release your hand, it will print out one line.</p>
<p>Each letter is printed on its own unique position and does not move laterally, so it is equivalent to a 21-hole punch tape. Letters are used to associate with words and be more readable by humans, but in machines it can be written as black circles or holes. For example,</p>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> H S I OIA </span>(人間)</div>
<div><span class="line"> K I IA K Y</span>(機械)</div>
<div><span class="line"> </span></div>
<div><span class="line dots">○○●○●○●○○○○○○●●●○○○○○</span>(人間)</div>
<div><span class="line dots">○○○●○○●○○○○○○○●●○●○○●</span>(機械)</div>
</div>
<div lang="ja">
<p class="contin">
と同じである。キーは10本の指で、任意の組み合わせが打てるように、特殊の形に配列してある。(図1)指の受持はつぎのとおる:
</p>
<img src="fingers-ja.png" alt="Finger layout (Japanese version)" />
</div>
<div lang="en">
<p class="contin">are identical. The keys are assigned to the ten fingers and arranged in a special shape so that you can hit any combination. (Figure 1) The keys are assigned to fingers as follows:</p>
<img src="fingers-en.png" alt="Finger layout (English version)" />
</div>
</section>
<section id="theory-basics">
<div lang="ja">
<h2>4 速記記号のあらまし</h2>
<h3>4.1 基本</h3>
<p>
20の文字キーを3つの群に分け、それぞれ左、右、中の群という。左の群は左手の4本の指が受け持つ8つのキーで、その情報数は2⁸
=256だから、五十音はもちろん、拗音、それらの長音(「〜おう」と「〜うう」)および「〜あい」、「〜えい」韻までをふくむ音節が区別される***。左の群の記号はそのまま裏返しにすれば右の群の記号となる。これらの記号はローマ字のように、子音+母音の構造になっているが、速記者の意識にはもはや子音、母音はなく
</p>
</div>
<div lang="en">
<h2>4 Shorthand Theory</h2>
<h3>4.1 Basics</h3>
<p>The 20 letter keys are divided into three banks: left, right, and center. The left bank has 8 keys controlled by the 4 fingers of the left hand, giving a total of 2⁸ = 256 possible chords. Not only the standard 50 syllables of Japanese, but also complex syllables including long sounds (〜おう and 〜うう) and even 〜あい and 〜えい can be distinguished. The keys on the left bank become the keys on the right bank by reversing the order. These keys have a consonant + vowel structure like the Roman alphabet, but the stenographer does not think of consonants or vowels,</p>
</div>
<div>
<img src="shapes.png" alt="Interpreting Sokutaipu outlines as shapes.">
</div>
<div lang="ja">
<p class="contin">など、それぞれの指の形が文字なのである。</p>
<p>
中の群は4つのキーだから、少数の限りられた音(つ、く、い、ん、ち、き、つまる音っ)が打てる。
</p>
<p>
この3つの群の音記号を基本という。これは一種の音文字であるが、これでことばを表わす場合、つぎの3つの重要な規則に従う:
</p>
<ol class="lettered">
<li>語の第1音節は左の群で打つ。</li>
<li>つぎの音節が中の群で打てる音ならば必ず中で打つ。</li>
<li>
1打にならない語は残りをまた規則(a)、(b)に準して左から打ちつぐ。
</li>
</ol>
<p>
基本はこの規則によって、2音節または3音節を1打にする。これはかなで書けば最長7字、平均4字か5字にあたるだろう。しかし、これだけではまだ人間のしゃべる速さに追いつけない。少なくとも、らくに追いつけないから、頻度の高い語に対して略語が決めてある。
</p>
</div>
<div lang="en">
<p class="contin">but rather the shape of the outline and the position of each finger.</p>
<p>The center bank has four keys, so you can hit a small number of sounds (つ, く, い, ん, ち, き, and geminated sounds).</p>
<p>These three banks comprise what are called the basic sound chords. This is a sort of phonetic alphabet, but when it comes to representing words, there are three important rules:</p>
<ol class="lettered">
<li>The first syllable of a word is written with the left bank.</li>
<li>If the next syllable can be written with the center bank, it must be written with the center bank.</li>
<li>For words that do not fit in one stroke, repeat the rest from the left according to rules (a) and (b).</li>
</ol>
<p>According to these basic rules, two or three syllables can be written in one stroke. The equivalent in kana would be up to 7 characters, or 4 to 5 on average. However, this alone still cannot keep up with the speed of human speech. Since it can be difficult to catch up, briefs have been assigned to the most frequently used words.</p>
</div>
</section>
<section id="briefs">
<div lang="ja">
<h2>4.2 略語</h2>
<p>
略語には6種類ばかりのタイプがあるが、だいたい一見して基本とは区別がつくようになっている。たとえば、
</p>
</div>
<div lang="en">
<h2>4.2 Briefs</h2>
<p>There are about six types of abbreviations, but most of them can be distinguished from basic phonetic outlines at a glance. For example,</p>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> K T </span>(くつ)</div>
</div>
<div lang="ja">
<p class="contin">は基本で「くつ」であるが、</p>
</div>
<div lang="en">
<p class="contin">represents くつ according to the phonetic rules, whereas</p>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> K T </span>(くべつ)</div>
</div>
<div lang="ja">
<p class="contin">は基本の規則(b)に違反しているから基本ではなく、「区別」という略語になる。また</p>
</div>
<div lang="en">
<p class="contin">violates basic rule (b), so it is not a basic phonetic outline but rather an abbreviation (in this case, for 区別). Similarly,</p>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> S </span>(すべて)</div>
</div>
<div lang="ja">
<p class="contin">は右で「す」と打ってあるが、基本ならば規則(a)(c)によって左があくことはない。これは「すべて」という略語になる。中の群れで打つ助詞、</p>
</div>
<div lang="en">
<p class="contin">represents す on the right bank, but according to basic rules (a) and (c) the left bank should not be left open. This is a brief for すべて. These center bank briefs for particles:</p>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> T </span>(に)</div>
<div><span class="line"> K </span>(が)</div>
<div><span class="line"> TK </span>(で)</div>
<div><span class="line"> I </span>(は)</div>
<div><span class="line"> N </span>(の)</div>
<div><span class="line"> IN </span>(も)</div>
</div>
<div lang="ja">
<p class="contin">およびその組合せの</p>
</div>
<div lang="en">
<p class="contin">and their combinations:</p>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> T IN </span>(にも)</div>
<div><span class="line"> TK I </span>(では)</div>
</div>
<div lang="ja">
<p class="contin">なども左があいているから略語である。これらは基本で打っても1打という点では同じだが、10打に1つぐらいの割ででるこういう助詞を親指(中)で打つと、その間4本の指は休んでつぎの準備をしているから、スムーズにリズミカルに打てるのである。</p>
<p>略語の各種類にわたって系統的に述べる紙数がないが、大別して片手略語と両手略語とになる。片手略語は左または右の片手で決まるもので、「され、られ、たら、たり、かた、きり、しか、はな」など意味の稀薄な、むしろ、2音のかなとみるべきものや「だけ、など、こと、から、ます、ある、あります、ました、ません」などのような形式語や助詞の類が多い。これに対して両手略語は両手で組み合って1つの略語になるもので、大部分がはっきりした実質語である。</p>
</div>
<div lang="en">
<p class="contin">are also briefs because they are open on the left. These are good briefs in that while each one is one stroke, when you write them with your thumbs, which occurs about once every 10 strokes, your four fingers rest and prepare for the next word. Because of this, you can write smoothly and rhythmically.</p>
<p>Although there is not enough paper to systematically discuss each type of brief, they can roughly be divided into one-handed briefs and two-handed briefs. One-handed briefs can be written on either the left or right bank, and include words with a weak meaning, such as され, られ, たら, たり, かた, きり, しか, and はな. This also includes formal words and particles such as だけ, など, こと, から, ます, ある, あります, ました, and ません. On the other hand, two-handed briefs are words that use both banks to form a single brief, and most of them are nouns.</p>
</div>
</section>
<section id="briefs-proportion">
<div lang="ja">
<h3>4.3 略語の数と割合</h3>
<p>略語の数は、現在は片手227、両手248、合計475が使われている。以前は片手231、両手609であったが、実際に速記したテープを調べると、だいたいつぎのような割合になっていた:</p>
<blockquote>
<p class="contin">
基本で打った行 40%<br>
片手略語を使った行 40%<br>
中の群の助詞 10%<br>
両手略語の行 10%
</p>
</blockquote>
<p>この結果でみると、ある1つの両手略語の出現度は片手略語に比べてきわめて低い。略語は頭でおぼえただけでは役にたたない;反復練習ほとんど無意識に反射的に指に出なければならない。その訓練の時間と努力を基本と片手略語にふりむけたほうが有利だという結論に達したので、10年ほど前に両手略語を大幅に減らしたのである。その結果は打数で2%弱の増となるが、総合的に速記者の成績はむしろ上っている。</p>
</div>
<div lang="en">
<h3>4.3 Proportion of Briefs</h3>
<p>There are currently a total of 475 briefs, 227 for one hand and 248 for both hands. Previously, the ratio was 231 for one hand and 609 for both hands, but when I examined the actual steno tape, the ratio was roughly as follows:</p>
<blockquote>
<table>
<tr><td>Phonetic outlines</td><td align="right">40%</td></tr>
<tr><td>One-handed briefs</td><td align="right">40%</td></tr>
<tr><td>Center-bank particles </td><td align="right">10%</td></tr>
<tr><td>Two-handed briefs</td><td align="right">10%</td></tr>
</table>
</blockquote>
<p>Looking at these results, the frequency of two-handed briefs is extremely low compared to one-handed briefs. Merely memorizing briefs is not useful; you have to practice them over and over until you can write them almost unconsciously and reflexively. I decided that it would be more advantageous to allocate training time to the basics and one-handed briefs, so about ten years ago I drastically reduced the number of two-handed briefs. This resulted in just under 2% more strokes, but overall the performance of stenographers has massively improved.</p>
</div>
</section>
<section id="kanji-designation">
<div lang="ja">
<h2>5 漢字入力への応用</h2>
<h3>5.1 漢字指定</h3>
<p>以上4.までで述べたのは、現在のソクタイプ速記のあらましを紹介したので、新しいことではない。この速記の打ち方を応用すれば普通の漢字かな文を機械に入力する速度を、現在の漢テレ式のさん孔機に比べて、5倍ないし7倍にあげることができる。その方法を紹介するのがこの論文の目的であって、以下にそのあらましを述べる。</p>
<p>速記記号は一種の音文字で、同音語は意味にかかわらなく同じ記号、反訳の際に前後から判断して文字を選んでいる。しかし、機械にはこの判断は困難であるから、適当な方法で漢字を区別する打つ方をすればこれを高速度漢字入力に利用することができる。幸い現在のソクタイプで中央の*印が、速記にはほとんど使わない遊びキーになっているので、これを漢字指定キーに利用できる。位置もあらかじめその目的で設計したかのように格好のところにある。</p>
<p>そこで、つぎのように決める。</p>
<ol class="lettered">
<li>基本はすべてひらがなにする。</li>
<li>略語で同音異語がなく、普通に漢字で書く語にそのまま漢字にする。たとえば</li>
</ol>
</div>
<div lang="en">
<h2>5 Kanji Input Approaches</h2>
<h3>5.1 Kanji Assignments</h3>
<p>What I have described in section 4 above is not new; that is just a summary of the current Sokutaipu theory. By applying this method, the speed at which ordinary kanji and kana characters can be entered into a machine can be increased 5 to 7 times compared to current Kanji teletype punching machines. The purpose of this paper is to introduce this method, and the outline is given below.</p>
<p>Shorthand outlines are a type of phonetic alphabet; homonyms have the same outline, regardless of meaning, and when translating, characters are selected based on context. However, it is difficult for machines to make this determination, so if you use an appropriate method to distinguish between kanji, you can use this for high-speed kanji input. Fortunately the <code>*</code> key in the center bank is rarely used for shorthand, so it can be used for specifying kanji. The location is perfect, as if it was designed that way on purpose.</p>
<p>Therefore, I have decided as follows:</p>
<ol class="lettered">
<li>All phonetic outlines should be in hiragana.</li>
<li>Briefs without homophones are written in kanji for words that are normally written in kanji. For example:</li>
</ol>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> K I S H </span><ruby>日本<rt>にほん</rt></ruby></div>
<div><span class="line"> TK O SK </span><ruby>問題<rt>もんだい</rt></ruby></div>
<div><span class="line"> HK I T </span><ruby>技術<rt></rt></ruby></div>
</div>
<div lang="ja">
<ol class="lettered" start="3">
<li>略語で同音異語があればその1つに決める。</li>
</ol>
</div>
<div lang="en">
<ol class="lettered" start="3">
<li>If the brief has homophones, choose one.</li>
</ol>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> TK O AS Y</span><ruby>政策<rt>せいさく</rt></ruby>(製作)</div>
<div><span class="line"> K S Y</span><ruby>証人<rt>しょうにん</rt></ruby>(商人、承認)</div>
<div><span class="line"> K A T </span><ruby>間接<rt>かんせつ</rt></ruby>(関節)</div>
</div>
<div lang="ja">
<p class="contin"> 括弧内の語は別の打ち法をする。</p>
<p>この(b)、(c)によって略語からすぐ漢字ででる語が約250語ある。</p>
<ol class="lettered" start="4">
<li>*印を利用して漢字1字ずつのコードをつくる。このコードの作り方は、つぎの5.2で別に述べる。</li>
<li>頻度の高い熟語には、略語のない場合にも熟語としてのコードをつくり、一挙に2字以上をまとめて指定する。最初この種類245語を選んで。</li>
</ol>
</div>
<div lang="en">
<p class="contin"> Parentheses indicate homonyms that are spelled differently.</p>
<p>Approximately 250 briefs can be written directly in kanji based on rules (b) and (c).</p>
<ol class="lettered" start="4">
<li>Use the <code>*</code> key in the center bank to create a code for each kanji. How to create this code will be described separately in section 5.2 below.</li>
<li>For frequently occurring expressions, codes are created even if they do not have briefs, and two or more characters are written at once. This covers an additional 245 words.</li>
</ol>
</div>
</section>
<section id="kanji-code">
<div lang="ja">
<h3>5.2 漢字コード</h3>
<p>ソクタイプの1打(21ビット)は200万以上の変化を持つから、1打で漢字1字を指定することはたやすいともいえるが、それを人間がおぼえて、とっさに出ることが必要だから、文字とコードとの連想、同一性をつく流のにくふうがいる。ただ、機械的に対応させたのでは、人間の側に通用しない、人間が発信するコードをつくるために、つぎの3つの方法をとる。</p>
<ol class="lettered">
<li>訓の強い文字は、その訓をキーワードとして、それをソクタイプの普通の打ち方で打つて同時に*を打つ。</li>
</ol>
</div>
<div lang="en">
<h3>5.2 Kanji Coding</h3>
<p>One stroke (21 bits) of Sokutaipu has more than 2 million possibele values, so while it is easy to specify kanji with one stroke, it is necessary for humans to memorize it so it can be written quickly. There is an method for creating associations between characters and codes. The following three methods are used to create codes that can be written by humans, as they would be difficult for humans if they were made strictly mechanically compatible.</p>
<ol class="lettered">
<li>For characters with a strong <i>kun</i> reading, use the <i>kun</i> reading as a keyword, write it normally, then press the <code>*</code> key at the same time.</li>
</ol>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> K I * I S </span><ruby>岸<rt>きし</rt></ruby></div>
<div><span class="line"> T K*I </span><ruby>月<rt>つき</rt></ruby></div>
</div>
<div lang="ja">
<ul>
<li class="empty">
<p>この種類、当用漢字1850のうつ660字約1/3にのぼる。</p>
<p><b>例:</b>花米母苗泥田土道丸岩岸顏月波板坂......</p>
<p>訓の中には後娘届柳卸戻薬畳など2打語もあるが、コードとしてはこのキーワードの第1打だけをとる。</p>
</li>
</ul>
<ol class="lettered" start="2">
<li>
<p>字音からコードをつくるものも250字ほどある。</p>
<p class="contin"><b>例:</b>盆晚案電度液芸菲不会......</p>
<p class="contin">なるべく訓のない字、音でつかうことの多い字、他の語に補足的につくことの多い字などを選んで。</p>
</li>
<li>熟語をキーワードとするもの。これが約半数である。キーワードはなるべく音訓のどちらか、1字の内部で処理するほうが、オペレータの心理的負担は軽いのであるが、多くの同音漢字を区別するために、その字を含む熟語をキーとすることはやむをえない。1つだけ実例をあげると、「ど」という音の字は「土度怒努」であるが、いちばん流動性の大きい「度」に音の「ど」をあて、「土」は訓の「つち」がよく固まっている。「怒」には「怒号」、「努」には「努力」をキーとする。</li>
</ol>
</div>
<div lang="en">
<ul>
<li class="empty">
<p>This accounts for 660 out of 1850, or about 1/3 of daily-use <i>tōyō</i> kanji.</p>
<p><b>Examples:</b> 花 米 母 苗 泥 田 土 道 丸 岩 岸 顏 月 波 板 坂</p>
<p>Although some of the kanji in this category, such as 後 娘 届 柳 卸 戻 薬 畳 need to be written in two strokes, only the first stroke is taken as the code.</p>
</li>
</ul>
<ol class="lettered" start="2">
<li>
<p>Another roughly 250 characters can be assigned codes solely from <i>on</i> readings.</p>
<p class="contin"><b>Examples:</b> 盆 晚 案 電 度 液 芸 菲 不 会</p>
<p class="contin">As much as possible, choose characters that have no meaning on their own, ones that are often used with sounds, or ones that are often used in combination with other words.</p>
</li>
<li>
Use expressions as keywords. This accounts for about half of kanji. The cognitive burden on the operator is lighter if keywords can be input from a single character as much as possible, but in order to distinguish between many homophone kanji, it is unavoidable to use a phrase containing that character as a key. For example, 土 度 怒 努 are all pronounced ど, but the sound code is assigned to 度 which is the most frequent, then 土 gets assigned its <i>kun</i> reading, つち. The remaining two can then have keys based on words containing them: the key for 怒 would be 怒号, and 努 would be 努力.
</li>
</ol>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line"> T T *I </span>土(つち)</div>
<div><span class="line"> THKS * </span>度(ど)</div>
<div><span class="line"> THKS * IA KH </span>怒(怒号)</div>
<div><span class="line"> TK* SHKT </span>努(努力)</div>
</div>
</section>
<section id="words-over-letters">
<div lang="ja">
<h2>6 熟語本位への切り換え</h2>
<h3>6.1 文字よりも単語</h3>
<p>以上ざっと説明した漢字指定の方法で少し実験してみたところ、分速250字(120〜130語)ぐらいは無理なくこなせることがわかった。</p>
<p>しかし、1つの漢字語を1字1字打つのと、1語としてらえるのでは非常に能率がちがう。ただ、打数など機械的の面だけでなく、心理的にも1字ずつの漢字を意識の表面に取り出すことはオペレータには大きな負担になる。</p>
<p>言語学的にみても、読んだり、書いたり、タイプしたり(しゃべったり、聞いたりはいわずもがな)、すべて国語を駆使する場合、文字は意識にのぼらないのが理想であり当然でもある。病的現象なのである。漢語でも文字の意識の強いうちは、未熟語イとみなければならない。</p>
<p>そので昨年(1969年)初め、漢字指定を単独漢字主義から熟語本位に切り換えた。切り換え前にも頻度の高い語、約500語は文字に分解せず、一塊として処理した(5.1(b)(c)(e))。今度はこれを約10000語に拡張した。10000語あればたいがいの安定した漢語ははいるから、オペレータの疲労度と速度に大きく影響すると思われる。</p>
<p>この10000語は筆者が辞書から選んだだけであるから、今後各方面の検討を期待する。語数も10000語と限ったことはない。20000でも3000でも機会の記憶能力は充分余裕がある。そんなに覚えるのはたいへんだろうという人もあったが、たいがいまともな漢語はみなあるとなればがえって覚えなくてもすむ。</p>
</div>
<div lang="en">
<h2>6 Handling Complex Expressions</h2>
<h3>6.1 Words over Letters</h3>
<p>I did a little experiment with the kanji assignment method as explained above, and found that I could easily write about 250 characters (120〜130 words) per minute.</p>
<p>However, there is a huge difference in efficiency between writing each kanji word one by one and treating it as a word. It is a heavy burden on the operator not only mechanically, with the number of strokes, but also mentally to recall each kanji.</p>
<p>From a linguistic point of view, when reading, writing, and typing (and not to mention speaking and listening), when using the Japanese language, it is ideal and natural that the letters do not even enter one's consciousness. Even with Chinese, while the awareness of letters is strong, they must be considered in combination rather than separately.</p>
<p>Therefore, starting last year (1969), we changed the designation of kanji from individual kanji to words and expressions. Before the switch, approximately 500 high-frequency words were input without bring broken down into letters; this time, I expanded it to about 10,000 words. Since 10,000 words can contain most of the standard kanji, I think this will greatly affect the operator's fatigue level at speed.</p>
<p>I simply selected these 10,000 words from a dictionary, so I hope that various aspects will be considered in the future. The number of words is also not limited; whether 20,000 or 3,000, the memory capacity is very high. Some people said it would be difficult to memorize that much, but if you already know all the proper words, you won't have to memorize them at all.</p>
</div>
</section>
<section id="homophones">
<div lang="ja">
<h3>6.2 同音語の処理</h3>
<p>漢語だいつも問題になるのは、同音語の取扱いである。漢字ソクタイプでは、言語音以外の方法で機械に漢字を指示するために、5種類の手段を用意している。音に関連を持ちながら、それぞれ打ち方を変えるのであるが、紙数がないから、詳しい説明は割愛し他日にゆずる。</p>
</div>
<div lang="en">
<h3>6.2 Homophones</h3>
<p>One problem that always arises when writing Chinese characters is the handling of homonyms. Kanji Sokutaipu provides five methods for instructing machines to write kanji using methods other than sounds. Although they are still related to sounds, they are written in different ways, but due to the lack of space, I will omit a detailed explanation and leave it for another day.</p>
</div>
</section>
<section id="conclusion">
<div lang="ja">
<h2>7 むすび</h2>
<p>漢字情報をふくむ21ビットのさん孔テープができたら、機械がこれを受けて普通文書をつくる道程については、将来もっと近道があると思うが、差し当たりは12ビットの漢テレテープにまず反訳するのである。</p>
<p>それによって、現在の端末機械(たとえば新聞社の漢テレやモノタイプ)に連結する。この反訳の字引と、プログラムは相当膨大ではあるが、今日の電算機の能力からは、むしろ軽い仕事かと思う。</p>
<p>この方法によれば、日本語の文書作成速度がのろいというなやみだけは解消する。現在の漢テレによる入力に比べて5倍ないし7倍、さらには速記、すなわち、口でしゃべる速さまで延びる見込みがある。</p>
<p>将来、日本語をローマ字で書く時代になっても、漢字を必要としなくなったソクタイプは、ローマ字タイプの2倍ぐらいの速度になると思われる。</p>
</div>
<div lang="en">
<h2>7 Conclusion</h2>
<p>Once a 21-bit perforated tape containing kanji information is made, I think there will be a method in the future for a machine to receive it and create a regular document, but for now we can translate it into a 12-bit kanji teletape.</p>
<p>As such, it can be connected to existing computer terminals (for example, newspaper companies' Kan-tele and Monotype). Although the translation dictionary and the program are quite large, I think it is a rather light task given the capabilities of today's computers.</p>
<p>This method eliminates the problem of slow document creation speed in Japanese. It is expected that the input speed will be five to seven times faster than current Kan-tele input speeds, and could even reach the speed of shorthand.</p>
<p>Even in the future, when Japanese is written in Roman letters, I think that Sokutaipu, which would no longer require kanji, will be about twice as fast as writing directly in Roman letters.</p>
</div>
<div class="steno">
<!-- YTHKSAIOTK*INOIASKHTY -->
<div><span class="line">Y IOTK INOIASKHTY</span>ということになっても</div>
<div><span class="line"> T S IOTK INO KH </span>つずけるのでございます</div>
<div><span class="line"> T KSAIOTK IN IAS H </span>ことわらなければならない</div>
</div>
<div lang="ja">
<p class="contin">など、かなの部分で速度がかせげるからである。</p>
<p class="contin">(昭和45年1月17日受付、同年5月1日再受付)</p>
</div>
<div lang="en">
<p class="contin">This is because the speed increase comes from the kana writing.</p>
<p class="contin">(Received on January 17, 1970, then again on May 1 of the same year.)</p>
</div>
</section>
</body>
</html>