浮動小数点誤差について

お世話になっております。

みゅうと申します。

 

SH7211上で動作していたプログラムを、SH7216上へと移植しているのですが、

演算の結果が同一にならず困っております。

 

厳密には8.333332500となるようなfloat値、8.333332①に対して×1000000②をすると

両CPU上で、共に8333333となります。(切り上げor制約?)

これに対して、元に戻す演算である、÷1000000をすると③

7211上では、8.333332になり(まるめ指定省略=round-nearest?)、

7216上では、8.333331になります(round-nearest指定)。

該当部のソースコードは以下です。

    p->acc_par_spd_par_2 = (float) p->accele / speed / 2;
    p_par2 = p->acc_par_spd_par_2;                 //① ※左辺右辺共にfloat型です
    p->acc_par_spd_par_2 *= (float) 1000000;  //②
    par2 = p->acc_par_spd_par_2 / 1000000;    //③ ※同上

また、SH7216において上記コード部によって算出した①③がそろっているように見えても、

実際には内部表現が異なる場合があります。

floatでは有効桁を超えた情報は欠落すると思っているのですが、

大小比較において真となります。

 

これらについて、詳細をご教授いただければと思います。よろしくお願いします。

Parents
  • >SH7211上で動作していたプログラムを、SH7216上へと移植しているのですが、
    >演算の結果が同一にならず困っております。
    これの回答は
    >SH7211はFPUが搭載されていない仕様に対して
    >SH7216は搭載されてる仕様みたい
    ということで、どうでしょう。
  • 返信ありがとうございます。こちらの返信が遅れましてすみません。

    SH7214として設定するという点や、コンパイラの他の設定、コンパイラ自体のバージョンについて、
    確認してみます。
    また、演算結果についてですが、移植したプログラムがうまく動作せず、
    可能性として、この浮動小数点値を用いてさらに計算をした値が、
    移植前後で異なっている事が原因か?という状況です。
    レベルの異なる周期割り込みが4種あり、動作不良の原因の特定が困難なので、
    可能性の一つとして値が異なるのを解消しておきたい、という状況です。
  • みゅうさん
    FPUを使用する、しないとか、設定もいろいろあると思いますよ
    型番自体が完全互換でない限りは動作が異なっていて当然のような気がします
    IOとかBUS周りINT関連とか基本的なところから、潰していくしかないですね。
  • > また、演算結果についてですが、移植したプログラムがうまく動作せず、
    > 可能性として、この浮動小数点値を用いてさらに計算をした値が、
    > 移植前後で異なっている事が原因か?という状況です。

    うまく動作しないという現象が再現性含めて確認できるのならそこから原因を突き止めるべきであり、なんかわからんけど違うところから同じにしていくかという方法は問題の原因との因果関係も不明なまゝ現象が現れなくなってしまう可能性もあり良い方法ではありません。
  • >演算結果についてですが、移植したプログラムがうまく動作せず、
    >可能性として、この浮動小数点値を用いてさらに計算をした値が、
    >移植前後で異なっている事が原因か?という状況です。
    >レベルの異なる周期割り込みが4種あり、動作不良の原因の特定が困難なので、
    >可能性の一つとして値が異なるのを解消しておきたい
    可能性の一つとして値が異なるということでしたので
    他にも問題個所があるのではと。まあ今わかっている問題解決を進めていくのは大切ですね。わたくし等は数万行あるようなソースの手あたり次第に調べていくのではなく、機能ごとに正常に動作しているのかどうか調べていきます、当然問題ない箇所も重複して確認することにはなりますが。

Reply
  • >演算結果についてですが、移植したプログラムがうまく動作せず、
    >可能性として、この浮動小数点値を用いてさらに計算をした値が、
    >移植前後で異なっている事が原因か?という状況です。
    >レベルの異なる周期割り込みが4種あり、動作不良の原因の特定が困難なので、
    >可能性の一つとして値が異なるのを解消しておきたい
    可能性の一つとして値が異なるということでしたので
    他にも問題個所があるのではと。まあ今わかっている問題解決を進めていくのは大切ですね。わたくし等は数万行あるようなソースの手あたり次第に調べていくのではなく、機能ごとに正常に動作しているのかどうか調べていきます、当然問題ない箇所も重複して確認することにはなりますが。

Children
  • 返信ありがとうございます。

    なんかわからんということではなく
    全く同じパラメータ・同じロジックでありながら演算結果が違うので、
    ほぼこれ、という段階でのことです。確定してはいないので可能性と表現しました。
    他に思いつく要因もありませんが、確定させるような検証をするには
    1から書きなおすのと同じくらいの時間が見込まれるので、
    ほぼこれ、というところから、アタリを付ける手を取っています。
    よろしくないことは承知しています。

    で、さしあたりなのですが、
    SH7214として設定してビルド、動作させたところ、値も一致し動作不良がなくなりました。
    SH7214はSH7216のFPUなし版、ということで、
    浮動小数点演算がFPUで(より正確に)行われることが原因ということだと思います。
    こうなると、関係する演算を見直すというか、
    演算に関して、書き直しだと思います……
  • > SH7214はSH7216のFPUなし版、ということで、
    > 浮動小数点演算がFPUで(より正確に)行われることが原因ということだと思います。

    ↓を見る限りではソフト float の SH7211 より FPU を搭載した SH7216 の方が誤差が大きく演算精度は悪そうです。

    > 両CPU上で、共に8333333となります。(切り上げor制約?)
    > これに対して、元に戻す演算である、÷1000000をすると③
    > 7211上では、8.333332になり(まるめ指定省略=round-nearest?)、
    > 7216上では、8.333331になります(round-nearest指定)。

    他、FPU からソフト float に変更することで動作不良が表れなくなったとして、演算精度の違い以外にも
    ・コードサイズの違いにより配置が異なり不具合が露見したりしなかったり
    ・演算速度の違いによりタイミングによる不具合が露見したりしなかったり
    ・NaN やゼロ除算等での振る舞いの違いにより不具合が露見したりしなかったり
    ・コンパイラやライブラリの不具合

    様々な可能性は考えられると思うので自分なら原因を決めつけるようなことはしませんね。