「電子工作な日々」カテゴリーアーカイブ

電子工作に関連するお話など・・

RXマイコン用 gcc-5.4.0 の構築

LTO のトラブルをうけて、gcc をより新しいバージョンへ移行する事にした。

とは言っても、時間はかかるものの(1時間もかからないが・・)、そんなに新しい
事は無い。

まず、パッケージの選択、6系は、まだ移るには早いようなので、5系の最新、5.4
にする。
合わせて、binutils、newlib も割と最新で統一した。

  binutils-2.27.tar.gz
  gcc-5.4.0.tar.gz
  newlib-2.4.0.tar.gz

今回から、C コンパイラのビルドオプションは、「--disable-multilib」に変更した。
32ビットのRXマイコンには必要ないうえに、付けるとビルド時間が長くなるようだ。

gcc-4.9.4 で、「-flto」を付けた場合に、リンク時に gcc がクラッシュするトラブルは
起こらないようだ・・
ただ、コンパイルするプログラムに依存すると思われるものなので、たまたま、クラッシュ
しないだけかもしれない・・
クラッシュするようだと、-flto は諦めるしかない・・・

・-flto の場合

   text    data     bss     dec     hex filename
   4012      48    1316    5376    1500 uart_sample.elf

・無しの場合

   text    data     bss     dec     hex filename
   4092      48    1316    5456    1550 uart_sample.elf

プログラムが短いので、効果が分かりにくいものの、小さくなっている。

gcc LTO のトラブル

最近 gcc の最適化オプションに関連するトラブルで悩んでいる・・・

gcc 4.8 から導入されたと言われる「LTO」(Link-Time Optimization)は、ソース単位
を超えた最適化を行う。
非常に有用で、サイズ、スピード、共に改善するようだ。

RL78では、SDカードを扱うようになってバイナリーサイズが肥大化してきたので、
積極的に「-flto」を追加するようになった。
バイナリーが10%程小さくなり、大きな効果がある事が分かった。

しかし・・・

最近、RL78のフラッシュ書き込みプログラムの実装を進めて、MSYS2環境では
書き込みが出来るようになった。
そこで、OS-XやLinuxでもテストを始めてみたのだが、書き込みプログラムは
MSYS2以外では動作しなかった。
まあこれは、仕方無い、原因を特定して修正するだけなのだが、問題は、OS-X、
Linuxでビルドした rl78-elf-gcc だった。
明らかにMSYS2で作成したバイナリーと異なっている。

調べると、どうやら、どこからも参照されないテーブルや関数が、全て無くなっていて、
最終的なバイナリーに含まれていない。
これは、主に、割り込みベクターや、割り込みプログラムなどで、無ければ当然動作し
ない。
しかしながら、MSYS2でビルドしたバイナリーには、ちゃんと含まれている。

つまり、MSYS2で作成した gcc と、OS-X、Linuxでビルドした gcc では
異なっているという事だ、確かに、ファイルパスの扱いなどが違うので、異なってはい
ると思うが、ビルドしたバイナリーが異なるのは、非常に問題だ。

リンカースクリプト内には、「KEEP」宣言もしてあっても、削除されてしまう。
※これは、MSYS2 でビルドした gcc では起こらない。

とりあえず、「#pragma GCC optimize ("O0")」をベクター領域で宣言する事で、回避
できる事は分かったものの、釈然としない・・
まだ LTO は実装が始まったばかりで、「枯れていない」という事なのかもしれない。

それと、RL78では、0x0000~0x2FFFまでの領域は、ミラー領域として、
データ領域のアクセスでは、実際には、0xF0000~0xF2FFFの、データ・
フラッシュ領域がアクセスされるのだが、LTOを使うと、コードが、0x0000~
0x2FFFまでには配置されずに、その領域を有効に使えない為、割り込み駆動のタ
スクをその領域に配置するようにセクションを調整しているものの、これも、全く配置
されない・・・
MSYS2 の gcc では、ちゃんと配置される。

さらに問題は色々あって、RX マイコン用 gcc でも、LTO を使うと、リンカー時に、
gcc がクラッシュする場合があるようだ・・・
これは、プログラムによって、する場合としない場合があるようで、非常に困る。
当面 LTO を使う事ができない。

gcc-5.4.0 で、このバグが直っているかもと思い、試してみたが、駄目のようだ・・・

RX64M 割り込みなど・・

RX64M用に定義ファイルの整備を進めている。

実装して、動かしてみると、RX63Tと色々違う部分も多い事が分かる。
大きく変わったところは、割り込みベクター関係で、割り込み要因や、ベクター番号
がかなり違う・・・
ペリフェラルが多いので、以前と同じようには扱えなくなり、苦肉の策で拡張した感
じが見受けられる。

たとえば、タイマー割り込み(CMT)は2ユニット2チャンネルあり、割り込みは
4つだが、そのうち2つを使う事ができる。(CMI0、CMI1)
CMI2、CMI3は、「選択型割り込み」に分類されており、要因と割り込みベク
ターをどうするかをプログラムしなければならない。

シリアルコミュニケーションでは、受信エラーと、送信完了割り込みが、グループ割
り込みに分類されており、それらを使う場合にやはりプログラムしなければならない。

送信動作は、送信完了割り込みを使った方が、実装が簡単なので、以前の実装では、
送信完了割り込みを使っていたが、そうすると、RX63Tなどと共通化が難しくな
るので、実装を変更して、送信割り込みに変更する事にした。

とりあえず、この割り込み修正は、うまくいった。

RX64Mの他にRX24Tも10個購入したので、近いうちに、LED点滅から始
める予定なのだが、主に、各ペリフェラルの制御クラスを共通化したいのだけど、
RX63T、RX64M、RX24T、RX621、RX630、RX62Nと、様
々なグループがあり、似ている部分とそうでも無い部分など、うまくグループの違い
を吸収する構成を考えないと・・・
img_0845s

RX64M UART(SCI)サンプル

俺俺 RX マイコンボードを作ろう!(その3)

RL78に寄り道していた為、RXマイコン関係はしばらく停滞していたが、ようやく
再開、RX64Mのブートが出来た。

RX64Mは、RXマイコングループ中では、かなり豪勢なデバイスで、単価も高く
2000円くらいした。
Flashは2MBあり、内蔵RAMも512Kバイトもある。
※外部バスに32ビットでSDRAMを繫ぐ予定なので、176ピンのタイプとした。

・176ピンLQFPタイプ
img_0844s

単純に電源を全て接続し、パスコンを入れ、制御端子を設定する。

今回、USB接続は行わず、シリアル接続とした。
※OS-XやLinuxの開発環境を意識している。

RL78やR8Cと違い、RXマイコンは内臓発信機を使う文化が無いため、必ず外部
にクリスタルを接続する必要がある。
※今回12MHzを使った。

RX64Mには高速オンチップオシレーターが内臓されており、16MHz、18MHz、20MHz
から選択できるようになっている。
しかし、やはりクリスタルの方が正確であるので、クリスタルを接続する事とする。
※最近の内臓発信器の精度は、極めて高いので、そのうち、クリスタルを必要としなくなるのだと思う。

EMLE(10) ---> Vss
MD/FINED(18) ---> Boot:Low / SingleChip:High
PC7/UB(76) ---> Vss (serial boot)
VCL(14) ---> 0.1uF で Vss に接続
RES#(21) ---> Reset ボタン(10K でプルアップ)

さて、ブートが出来たので、早速LEDの点滅でもやってみよう~
RX64Mには、非常に沢山のI/Oがあるので、定義を実装するのは相当時間がかか
りそうではある・・・、かなり共通に出来そうなのと、R8C、RL78で、テンプレ
ートの書き方が進歩した事もあり、洗練されてきている感があるが、とりあえず、必要
になったら実装する感じで、進める事とする~

さて、LEDをどこに接続するか・・・
色々考えたが、P07(176)に吸い込みで赤色LEDを接続した、電流制限は
1.5Kオーム

電源用にブルーLEDでも接続しようと思ったが、古いロットなので、順方向電圧降下が
3.8Vもあり、無理と分かった・・・
最近のブルーLEDは、VFが2.9Vとかで、効率が上がっている。

LEDの点滅は、簡単なので、直ぐに出来た。

rx64m_first_sample

RL78/G13のフラッシュ書き込みプログラム

やっと、RL78のフラッシュへの書き込みが出来るようになった。

これで、「Renesas Flash Programmer」に頼る必要が無くなったと言いたいところだけど、
書き込めるのは Windows 環境のみという現状・・・
OS-Xでは、初期のブートモードにエントリーする部分で失敗し、Linux 環境では、初
期設定で失敗する。

調べると、どうも、シリアルドライバーの不具合のように思うが、ドライバーは最新のよ
うでもある・・・
現在USBシリアルチップはFTDIのFT231XSを使っているだが、別のチップで
試してみたいので、中華製のアダプターを複数購入、配達待ちとなっている。

ソースコード共通化の為、「termios.h」の API を使っているけど、逆に Windows 版が、
バグがあり、偶然通信できているだけなのかもしれない。

一番の懸念は、RL78のブートモードで、TOOL端子1本を使う半二重モードは、
PC->RL78は「2ストップビット」、RL78->PCは「1ストップビット」と
変則仕様になっている・・(何故、こんな仕様にしたのか、問いただしたい!)
一般的なシリアルドライバーでは、受信と送信で別々の通信フォーマットを設定できるよ
うには作られていない為、本来なら、これは、フレーミングエラーが発生してまともに通
信できないのだが、termios API で、これを無視する設定があり、Windows では、それが
機能しており、通信ができている。

Linux のドライバーは、無視する設定をしても、無視してくれないようだ・・・

一方OS-Xでは、送信データ出力のレベルを制御する機能が正常に動作していないよう
で、RL78をブートモードに「入れる」事が出来ずに失敗する。

-----

・RL78/G13(128K)のみの検証
・データフラッシュへの書き込みは試していない
・単線式の書き込みモードのみ対応
・リセット制御は、RTS端子を利用

RL78へのフラッシュ・プログラムは、R8CともRXとも違う仕様で(元々メーカー
が違うのでしょうがないのだけど・・・)動くまでに多少時間を要した。

RL78では、以下の特徴がある:
・基本的に内臓フラッシュの読み出しは行えない。
・「Verify」は行える。
・書き込み時に、内部で「Verify」も行う為、書き込み終了時に「Verify」を行う必要が
ほぼ無い。

RL78(GitHub)

Renesas RL78 Series Programmer Version 0.10b
Copyright (C) 2016, Hiramatsu Kunihito (hira@rvf-rc45.net)
usage:
rl78_prog [options] [mot file] ...

Options :
    -P PORT,   --port=PORT        Specify serial port
    -s SPEED,  --speed=SPEED      Specify serial speed
    -d DEVICE, --device=DEVICE    Specify device name
    -V VOLTAGE, --voltage=VOLTAGE Specify CPU voltage
    -e, --erase                   Perform a device erase to a minimum
    -v, --verify                  Perform data verify
    -w, --write                   Perform data write
    --progress                    display Progress output
    --device-list                 Display device list
    --verbose                     Verbose output
    -h, --help                    Display this

RL78_FlashProgrammer

汎用的なMakefile

主に更新を続けている Git なのだけど、ちょっとした工夫で、開発環境が
より良くなる事は多い。

以前から、Makefile を少しづつアップデートをし続けて、現在に至ってい
る。
知り合いに、cmake を使うと柔軟で便利と言われていて、確かにそうだけど、
そこは天邪鬼な自分、「make」だけで何とかならないか・・・
※cmake を使って Makefile を作る手間が面倒

gcc のビルドだと、最初に「configure」を動かして、ビルドのオプション
を設定し、必要な中間ファイルを作成したりして、最終的に「Makefile」が
作成される。

また、Windows、OS-X を主なプラットホームにしているので、どちらでも遜
色無く機能してもらい、一元管理したい。

結局、「Makefile」だけの工夫で、全てまかなえている。
・従属規則を自動で生成する事
・コンパイルして生成したオブジェクトを1つのディレクトリーに集約する事
・リリース、デバッグなどのビルド切り替えが出来る事
・基本「make」だけタイプすれば、全てが生成できる事

ユーザーが記述すべき部分:

#=======================================================#
#                                                       #
#   RL78 Makefile                                       #
#                                                       #
#=======================================================#
TARGET      =    lcd_filer_sample
DEVICE      =    R5F100LGAFB
FATFS_VER   =    ff12a
BUILD       =    release
VPATH       =    ../
ASOURCES    =    common/start.s
CSOURCES    =    common/init.c \
                 common/vect.c \
                 common/option_bytes.c \
                 $(FATFS_VER)/src/ff.c \
                 $(FATFS_VER)/src/option/unicode.c \
                 common/time.c
PSOURCES    =    main.cpp \
                 common/font6x12.cpp

これは、「RL78/G13」の「Makefile」の先頭部分ではあるが、基本的に、ソース
コードの指定だけすれば良い。
従属規則は、自動で生成される。
「ASOURCES」はアセンブラのソース
「CSOURCES」は C 用ソース
「PSOURCES」は C++ 用ソースとなっている。
バックスラッシュで改行をエスケープして、1行に1ファイルとしている。
※この方が見やすいし、再利用する場合に利便性が高い。

「VPATH」は特別な変数で、この場合、一つ手前のディレクトリー以下にあるファ
イルを参照出来るようにしている。
※「VPATH」の値には make がサーチするディレクトリのリストを指定します。

「BUILD」に「release」とすれば、リリースビルド、「debug」とすればデバッグ
ビルドとなる。
生成されたオブジェクトは、「release」又は「debug」ディレクトリーが作られて
その中に全て格納される。
この中には、従属規則のパスが記述されたファイル、「source.d」も格納される。

新しいプロジェクトでは、Makefile をコピーして、必要な部分を少し編集すれば
良く、IDE でプロジェクトを再設定するより簡単だとおもう、この辺りも、IDE を
使わない理由の一つだと思う。

デバッグとリリース時のコンパイラオプションの違い:

ifeq ($(BUILD),debug)
    POPT += -g
    COPT += -g
    PFLAGS += -DDEBUG
    CFLAGS += -DDEBUG
endif

ifeq ($(BUILD),release)
    PFLAGS += -DNDEBUG
    CFLAGS += -DNDEBUG
endif

ビルド・ディレクトリーが「release」か、「debug」で、コンパイル・オプション
を切り替えている。

従属規則の自動生成:
これが、一番のキモとも言える、従属規則は、ソースコードでインクルードされた
全てのファイルパスを示したもので、この規則を使って、「make」がファイルの更
新が起こった場合に自動で対応するソースをコンパイルする事が出来る。

この規則を自分で記述するのは愚かと思えるくらい面倒で、ソースのインクルード
を増やしたり減らしたりする度に記述をやりなおさないとならないし、インクルー
ドを全て巡らないとならない。
※大抵、make の入門編などでは、これを入力させるように説明している事が多い。

そこで、これらを、ソースコードから辿って、自動で生成する事にした。
以前は、専用コマンド「makedepend」を使っていたが、gcc に「-MM」というオプ
ションがありこれにより、ソースコードがインクルードしているファイルをリスト
出来る、ただし、gcc が出力するパスは、完全では無い為、「sed」を使って、完
全なパスを生成するように工夫している。

$(BUILD)/%.d: %.c
    mkdir -p $(dir $@); \
    $(CC) -MM -DDEPEND_ESCAPE $(COPT) $(CFLAGS) $(APPINCS) $< \
    | sed 's/$(notdir $*)\.o:/$(subst /,\/,$(patsubst %.d,%.o,$@) $@):/' > $@ ; \
    [ -s $@ ] || rm -f $@

※ C ソース用

$(BUILD)/%.d: %.cpp
    mkdir -p $(dir $@); \
    $(CP) -MM -DDEPEND_ESCAPE $(POPT) $(PFLAGS) $(APPINCS) $< \
    | sed 's/$(notdir $*)\.o:/$(subst /,\/,$(patsubst %.d,%.o,$@) $@):/' > $@ ; \
    [ -s $@ ] || rm -f $@

※ C++ ソース用
※「DEPEND_ESCAPE」は、特定のヘッダーで、従属規則が正しく生成できない場合に、
それをエスケープする。

release/main.o release/main.d: main.cpp ../G13/system.hpp ../common/io_utils.hpp \
 ../common/port_utils.hpp ../G13/port.hpp ../common/fifo.hpp \
 ../common/uart_io.hpp ../G13/sau.hpp ../G13/intr.hpp \
 ../common/itimer.hpp ../G13/timer.hpp ../common/task.hpp \
 ../common/adc_io.hpp ../G13/adc.hpp ../common/delay.hpp \
 ../common/format.hpp ../common/monograph.hpp ../common/font6x12.hpp \
 ../common/kfont12.hpp ../ff12a/src/ff.h ../ff12a/src/integer.h \
 ../ff12a/src/ffconf.h ../common/sdc_io.hpp ../ff12a/mmc_io.hpp \
 ../common/csi_io.hpp ../ff12a/src/diskio.h ../common/string_utils.hpp \
 ../common/time.h ../common/filer.hpp ../common/bitset.hpp \
 ../common/switch_man.hpp ../chip/ST7565.hpp

※これは、自動で生成された、「main.cpp」の従属規則「release/main.d」

プラットホーム毎の違いを吸収する:

ifeq ($(OS),Windows_NT)
SYSTEM := WIN
else
  UNAME := $(shell uname -s)
  ifeq ($(UNAME),Linux)
    SYSTEM := LINUX
  endif
  ifeq ($(UNAME),Darwin)
    SYSTEM := OSX
    OSX_VER := $(shell sw_vers -productVersion | sed 's/^\([0-9]*.[0-9]*\).[0-9]*/\1/')
  endif
endif

この判定で、変数「SYSTEM」にOSの属性が代入される。
又、「OSX」の場合、「OSX_VER」にバージョン番号が代入される。

RL78/G13でWAVプレイヤーとLCD表示を合体させてみた

前回、大きなプログラムが動かない場合がある不具合の原因を取り除いて
から、信頼性が向上した為、ようやく不安無く大きなプログラムを作る事
ができるようになった。

そこで、以前に作ったWAVプレイヤーに、LCDファイラーなどを合体
させて、単独で機能するプレイヤーにアップデートしてみた。

   text    data     bss     dec     hex filename
  85991     112    3744   89847   15ef7 wav_play_sample.elf

かなり巨大になり、書き込み時間もそれなりにかかるようになった・・・
RAMは、合計4Kバイト程、スタックに最大1Kくらいは使うと思うの
で5K程、まだまだ余裕がある、思った程消費していない。
プログラムは、「15EF7」だけど、実際には0x3000から始まる
ので、96K程消費している。
R5F100LGAFB (FLASH:128K, RAM:12K, DATA-FLASH:8K) @340
は、バランスが良いデバイスなのかもしれない。

RL78のI/Oを制御するテンプレートクラスは、このような場合にリ
ソースの割り当てが柔軟なので、かなり楽が出来る、しかも、余分なコー
ドが入らないから、高速に動作し、メモリーの節約にもなる。
やはり C++ は組み込みマイコンに適した言語なのだと思える。

※ファイル選択の様子
img_0840s

起動時:
・左ボタンでファイラー起動
・十字ボタンの上下でファイルを選択
・十字ボタンの右で、再生(ディレクトリーの場合は、移動)
・十字ボタンの左で、ディレクトリーを戻る
・右ボタンで、ディレクトリー連続再生

再生中:
・十字ボタンの右で、次の曲
・十字ボタンの左で、曲の先頭
・左ボタンで一時停止

※再生中
img_0841s
※WAVファイルには、TAG情報が含まれているので、それを表示してい
る。

再生中に、経過時間を表示したいが、16ビットステレオの44.1KHz
では、ループに余裕が無く、LCDの書き換えをリアルタイムに行なえない。
SPI通信をDMAにするとか、時分割処理が必要なので、この機能は現在
は実装していない、そのうち対応したい。

外部に接続した、ターミナルには、経過時間(1秒毎)を表示している。
また、ターミナルからの操作も常に受け付ける。

RL78/G13 WAVプレイヤー

RL78/G13によるシリーズ・スイッチの判定

このネタは、良くある複数スイッチを抵抗ネットワークでデコードして、1本
のポートで読み込む為のガジェットで目新しさはあまり無い。

原理と動作は、分圧する抵抗を適切に選んで、直線性を維持する事で(直線性
が確かならデコードするソフトが楽なだけではあるけども・・)、かなり多く
のスイッチをデコードする事が可能となる、ただし、入力は排他的で、上位の
スイッチが常に優先される仕様となる。
※A/D変換の分解能を10ビットとした場合、抵抗ネットワークの直線性誤
差が+-10%の範囲なら5個のスイッチを認識できる事になる。
(計算方法が間違ってるかもしれないが・・)
※又、一般に流通している抵抗値には、限りがあるので、微妙な抵抗値を使っ
たネットワークは作りにくい為、あまり多くのスイッチを並べる事は難しいと
思われる。

方向スイッチ:
dir_switch
※試作では、6.8Kが無かったので、3.3Kを2個直列にした。

変形として、ネットワークのトポロジーを変えて、複数同時押しが可能なよう
なものも作れる、ただし、多くのスイッチを判定するのはより難しくなる。

スイッチ判定:

    enum class SWITCH : uint8_t {
        RIGHT,
        UP,
        DOWN,
        LEFT,
        A,
        B
    };

    // 4つのスイッチ判定(排他的)
    auto val = adc_.get(2);
    val >>= 6;   // 0 to 1023
    val += 128;  // 閾値のオフセット(1024 / 4(SWITCH) / 2)
    val /= 256;  // デコード(1024 / 4(SWITCH)

    switch_bits tmp;
    if(val < 4) {
        tmp.set(static_cast(val));
    }

ABスイッチ:
ab_switch
※もっと賢い抵抗値の選び方もあると思うので、参考程度に・・

    // 2つのスイッチ判定(同時押し判定)
    val = adc_.get(3);
    val >>= 6;  // 0 to 1023
    if(val < 256) {
        tmp.set(SWITCH::A);
        tmp.set(SWITCH::B);
    } else if(val < 594) {
        tmp.set(SWITCH::A);
    } else if(val < 722) {
        tmp.set(SWITCH::B);
    }

img_0837s

RL78/G13 A/D スイッチ・サンプル

RL78/G13、LCDへの漢字表示(ファイラー)

かなり昔にAVRマイコンで、データロガーを作成した時、既に漢字の表示
は対応していたが、RL78でも漢字に対応した。

表示フォントは12ピクセルを使う。
これは、表示の限界(難しい漢字は、判読出来ないが・・)少しでも情報量
を多くしたいのが理由としてある、16ピクセルの方が判読しやすいが、表
示のバランス的には12ピクセルの方が好みな感じ。

但し、いくつか制限がある、漢字のビットマップフォントを置く容量が無い
為、どこか別途、配置する必要がある。
※RL78(256Kデバイスなら、Flashに置く事が可能)
・12ピクセルフォントで、136キロバイト程の容量が必要。
・1MビットのEEPROMにも入らない。
・SDカードを接続するシステムなら、SDカード上に漢字ビットマップを
置く事で、描画が可能。
・キャッシュを設ける事で描画パフォーマンスを最適化。

12ピクセルのフリーフォントは色々あるけれども、今回は、蕨12を使った。
フォントデータはBDF形式なので、展開して、バイナリーデータにする。
この際、SJIS形式の並びとした、そうする事で、効率良く配置でき、無駄
が比較的少ない。
SJISのコードから、漢字のリニアアドレスを得る関数として、以下のコード
を使う。

static uint16_t sjis_to_liner_(uint16_t sjis)
{
    uint16_t code;
    uint8_t up = sjis >> 8;
    uint8_t lo = sjis & 0xff;
    if(0x81 <= up && up <= 0x9f) {
        code = up - 0x81;
    } else if(0xe0 <= up && up <= 0xef) {
        code = (0x9f + 1 - 0x81) + up - 0xe0;
    } else {
        return 0xffff;
    }
    uint16_t loa = (0x7e + 1 - 0x40) + (0xfc + 1 - 0x80);
    if(0x40 <= lo && lo <= 0x7e) {
        code *= loa;
        code += lo - 0x40;
    } else if(0x80 <= lo && lo <= 0xfc) {
        code *= loa;
        code += 0x7e + 1 - 0x40;
        code += lo - 0x80;
    } else {
        return 0xffff;
    }
    return code;
}

BDF形式を展開して、バイナリーデータを作成するアプリケーションは、以前に
作成した「bmc」を使う。
ビットマップ変換
この変換プログラムをコンパイルするには、mingw64 か、OS-X(Linux)で行なう必
要がある、詳細は、glfw3_app を参照して欲しい。

また、バイナリーデータは、蕨12フォントSJISバイナリーに置いてある。

漢字表示のアプリとして、ファイラーを作成した。
RL78/G13 SD カード LCD ファイラー

img_0833s
img_0832s
SDカード上のファイル選択の様子:
・LCDの横幅を超えるファイルは、自動でスクロールする。
・選択中は、反転表示。
・ディレクトリーの移動が可能。

RL78/G13の gcc での最適化に関するトラブル

LCDに表示するプログラムを実装するようになって、何か、正しく動かない事
が、頻発してきた。
※実際は、以前から、あったのだが、何かの拍子に直ったりする為、原因を究明
出来ないでいた。
よくよく調べると、最適化オプション「-Os」を使う場合に、起こる事がある事が
判った。
-O1、-O2 では発生しない為、とりあえず、-O2 を使っていたのだが、プログラム
の容量が増してくると、そうもいかなくなってくる。

そこで、コードを簡単に追ってみると、スタック領域に配置された変数にアクセス
する場合に、スタックのアドレス計算を間違っているような挙動だった。

これは、コンパイラの問題のように思うが、RL78のコード生成部分を追って、
修正するには、スキルと時間が足りないように思う。
それと、コンパイラのバグと思っていた事が、実際には、実装の問題である事は、
良くある話でもある。
そこで、回避策を色々試してみた結果、コンパイラオプション「-flto」を追加す
る事で回避出来ているように思う。

詳細に調べた結果、RAMの初期状態に依存していただけだった。
通常「.bss」セクションは「0」クリアするが、「.data」セクションは、何かの
値をロードするので、そのままな状態になっている、これが、問題のようで、
ロードしない場所は「0」クリアする必要がある。
そこで、リセット時、全てのRAMを全て「0」クリアするコードを追加した。

;; clear all RAM
    sel     rb0    ; bank 0
    movw    hl, #__datastart
LC0:
    movw    ax, #0
    movw    [hl], ax
    incw    hl
    incw    hl
    movw    ax, hl
    cmpw    ax, #__stack
    bnz	    $LC0

※レジスタ・バンクは触らない。
この変更で、怪しい挙動は、無くなったようではある。

ただ、コンパイラを作りなおす必要がある。
コンパイラは作り直さなくても大丈夫と判った、でも、4.9.4 の方が、ほんの
少しは、最適化が良いのかもしれないので、4.9.4 にするのはやぶさかでは無い。

※最近、gcc-4.9.3 から、gcc-4.9.4 に移ったので、その過程で、ビルドオプシ
ョンを精査した。

--enable-multilib --enable-lto

を追加する。
※「multilib」は以前は「disable」であったが一応「enable」とした。

「-flto」は、LTO(Link Time Optimization)を有効にするオプションで、これによ
り翻訳単位を超えた最適化が可能になる。
これは、gcc-4.8.x から、追加された機能のようだが、RL78 と、gcc-4.9.4 の場
合は、常に「有効」にする必要があるのかもしれない。
※指定しないと、「有効」になっているようである。

とりあえず、現状で、これで回避できているようではある・・・