データマージによる自動ページアップシステム概要

データベースの英語・各国語データを活用した各国語自動ページアップの支援を行う。
特に膨大なイラストデータを貼り込むような印刷物の製作では、第一処理言語(英語)のイラストデータの張り込みが完了した時点で、そのレイアウトをそのまま各国語版に流用することが必須になる。
膨大なページにまたがる手作業でのページアップを各国語についてすべて行うのは時間的に不毛な作業である。
レイアウトやイラスト情報はそのままで、テキストデータだけを差し替える高速で正確なマージシステムが必要とされる由縁である。

処理手順)

  1. データベースシステム(VPMG1)で製作した英語版の既存管理コード付きデータを使用し、指示稿に基づいて新バージョンのページアップ(DTP作業)を行う。
    管理コードは隠し文字として各データの先頭にはいっている。隠し文字はDTPの表示・印刷には影響を与えない。
  2. 追加データも各プログラムを利用し、すべて管理コード付きでページアップを行う。
  3. ページアップ完成後 VPMG1 (コード生成プログラム)を使用し、新しい機種名(コード区分)の管理コードを埋めこむ。
例)
@TAG = <$!D!ea5!e-part1.wp!123><$!D!ga!e-part1.wp!321>Abcdefg.....
前のコードは新機種のデータ番号、後のコードは既に付いている旧機種のデータベース番号である。
  1. マージキーは旧管理コード。言語区分を読みかえることによって同一文章の各国語データーを検索引用する。
  2. VPシステムファイル(chp, cif, vgr, sty)も一括変換し、マージ後のデータはそのまま各国語VPデータに変換されている。(各国語バージョンの自動ページアップ)

3. でもう一度新コードを生成する理由:
新機種としてのシーケンス番号を振ることにより、データー抜け等の検査を行い、同時に新バージョンで新に埋め込まれる記号類の転機を行う。
(現在ではマージ前にテキストのみをシーケンシャルに比較し、数字、ボールド文字、記号とうの等価チェックをプログラム的に行っている。)

  1. 初回マージで既存データの収拾が既にページアップされた形で行われるので、そのままDTP文書として開き、細部の調整的な編集・加工を施し、各国語バージョンとして完成させる。

コードの生成やマージ処理が非常に高速(秒単位)で、すべてのファイルの一括処理が可能であるので、後にマスター版(英語版)の大幅な追加変更があるときにはレイアウト変更のための再マージ処理を任意に行うこともできる。

 

技術資料

ファイルの種類 

 

WP5.1

WP4.2

ASCII

ANSI

VP-CAP

ファイル形式

改行(CR)情報

BINARY

CR: 0A(H)

BINARY

CR: 0A(H)

TEXT

CR: 0D 0A(H)

TEXT

CR: 0D 0A(H)

TEXT

CR: 0D 0A 0D 0A (H)

アクセントコード

WP5.1コード

形式(H):

C0 XX XX C0

WP4.2コード

形式(H):

E1 XX E1

IBM拡張コード

(H) 80 - FF

ANSI コード

(H) 80 - FF

IBM拡張コードの10進テキスト表記

<128> - <255>

ボルドー文字

形式(H):

C3 0C C3 TEXT C4 OC C4

形式(H):

9D TEXT 9C

定義なし 定義なし 形式(ASCII)

<B>TEXT<D>

WP5.1 ファイル補足

2. PREFIX

制御コード埋め込み式のワープロバイナリファイルであるが、イニシャライズ情報をヘッダーとしてもっている(PREFIX)。このフロックは可変長で文字情報にアクセスするには文字データフロックの開始アドレスを取得することが必要になる。

PREFIX の構造

FF 57 50 43 XX XX XX XX ........

2バイト目からの3文字がWPIDと称する文字列で、ASCIIの「WPC」。当システムのプログラムはすべてこのIDを読み取り、WP5.1形式かどうかを判定する。5バイト目からの4バイトは長整数(LONG)形式でこれがデータブロック(文字情報)のファイル頭からの相対開始アドレスを示している。

2. 制御コード

上記表で示したようにアクセント関係、ボルドー指標等は3から4バイトの固定長で埋めこまれている。また、改ページ記号、ソフトリターン+改ページ記号等も固定長である。これらの情報は当システムプログラム上でWP5.1の規定値として適宜変換あるいは削除している。
 
しかし、インデントやアドバーンス記号のように埋めこまれる条件によって値がかわり、可変長になる記号も頻出する。これらは既定値として外部プログラムからアクセスするのは複雑なアルゴリスムが必要になり現実的ではない。我々が利用するのは文字情報+ボルドー記号のみなので、当システムではこれらの可変長制御情報が入ったWP5.1ファイルはサポートしない。(タブは例外として処理対象とする。)
 

WP5.1ファイルについての制限事項

  • Ventura Publisher 又は Corel Ventura で WP5.1形式としてセーブされたデータは次の例外をのぞき当システムプログラムで処理できる。VPがWPをロードするとき、すべての無効な制御コードをフィルトリングするためである。

    例外)アドバーンスコード(VPのマニュアルには記載されていないが<D-22>、VP上で入力してもセーブ時にWP5.1コードに変換するようである。 使用禁止。)

  • 尚、簡単にWP制御コードをフィルトリングしたいときには、おまけツール「WPFILTER]を使用すること。この場合の出力オプションボタンの設定はWP5.1 → WP5.1 にする。

    要するに、WP5.1上で編集作業をしたファイルはVENTURA上でセーブしない限り当システムでの直接処理を保証しない。(--;)