# บทที่ 1 ตัวเลขและการวิเคราะห์ความคลาดเคลื่อน

> Mathematically correct programming bug is **hard** to spot.

> สมการถูกแต่...โปรแกรมผิด

>> Paulgramming - 2017


# ตัวเลขและความคลาดเคลื่อนในโปรแกรม
## C++

```c++
#include <iostream>
using namespace std;
main() {
  float x = 1.0;    
  float y = x / 3.0;
  cout << ((x == y * 3.0)?"": "Not") << " Equal" << endl;
}
```


# ตัวเลขและความคลาดเคลื่อนในโปรแกรม
## Java

```java
public class Test {
  public static void main(String[] a) {
    float x = 1.0;
    float y = x / 3.0;
    System.out.println( ((x == y * 3.0)?"": "Not") + " Equal" );
  }
}
```


# ตัวเลขและความคลาดเคลื่อนในโปรแกรม
## Python

```python
x = 1.0
y = x / 3.0
print("Equal" if x == y*3.0 else "Not Equal")
```

In [None]:
# มีหลายตัวเลขที่ไม่
x = 1.0
y = x / 3.0
print("Equal" if x == y*3.0 else "Not Equal")

# มีหลายตัวเลขที่คอมเก็บค่าไ่ม่ได้

* ตัวเลขที่คอมพิวเตอร์ต้องประมาณการ (Inexact numbers)
    * ค่าอตรรกยะ (irrational numbers) $\pi, \e, ...$
    * ค่าตรรกยะ (rational numbers) ที่ไม่สามารถแปลงเป็นเลขฐานสองได้
```python
0.1 + 0.2 == 0.3
```

* ตัวเลขที่คอมพิวเตอร์สามารถเก็บค่าได้ตรง (Exact numbers)
> ตัวเลขที่สามารถแปลงให้เป็นเลขฐานสองได้

## Floating-Point Binary

> ตัวเลข(number) เขียนแทนด้วยสายของเลขเดี่ยว(digit) โดยจำนวนของเลขเดี่ยว ขึ้นอยู่กับ เลขฐาน(base)

ในระบบจำนวนนับของคนเราจะเป็นเลขฐาน 10 โดยมี digit ที่ใช้ได้ได้แก่ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
ยกตัวอย่างตัวเลขในเลขฐาน 10 เช่น  128  77  12100  เป็นต้น

ตัวเลขที่ใช้ในคอมพิวเตอร์จะเป็นเลขฐาน 2 โดยมี digit ที่ใช้ได้ ได้แก่ 0 และ 1 
ยกตัวอย่างตัวเลขในเลขฐาน 2 เช่น  1, 101, 1101  เป็นต้น

# Terminology
** Bit **
: 0 or 1

** Byte ** 
: 8 bits

** Real **
: 4 bytes **single precision**
: 8 bytes **double precision**

** Integer **
: 1, 2, 4, or 8 byte signed
: 1, 2, 4, or 8 byte unsigned

> ขึ้นอยู่กับภาษาโปรแกรมว่าจะใช้สายที่มีความยาวเท่าไหร่ 8, 16, 32 หรือ 64 เป็นต้น


# ข้อตกลง

* เพื่อง่ายต่อการคำนวณเราจะใช้สายที่มีความยาว 8 และเขียนแยกเป็นกลุ่มละ 4 เพื่อง่ายต่อการคำนวน 

> เช่น  1 = 0000 0001



# Binary $\rightarrow$ Integer

|      |      |      |      |      |      |      |      |
|------|------|------|------|------|------|------|------|
|   1  |   1  |   1  |   0  |   0  |   1  |   1  |   1  |
|$2^7$ |$2^6$ |$2^5$ |$2^4$ |$2^3$ |$2^2$ |$2^1$ |$2^0$ |

$1\times2^7 + 1\times2^6 + 1\times2^5 + 0\times2^4 + 0\times2^3 + 1\times2^2 + 1\times2^1 + 1\times2^0$

$1\times 128+ 1\times 64 + 1\times 32 + 0\times 16 + 0\times 8 + 1\times 4 + 1\times 2 + 1 \times 1$


$128 + 64 + 32 + 0 + 0 + 4 + 2 + 1$

**Answer**
> $231$

# เขียนโปรแกรมทดสอบ

* คำนวณหาผลลัพธ์
```python
1*2**7 + 1*2**6 + 1*2**5 + 0*2**4 + 0*2**3 + 1*2**2 + 1*2**1 + 1*2**0
```

* คำสั่งแปลงเลขฐานต่างๆ
```python
int('11100111', 2)  # แปลง str '11100111' ฐาน 2 เป็น int
oct(35)             # แปลง 35 ฐานสิบ ให้เป็นฐาน 8
hex(35)             # แปลง 35 ฐานสิบ ให้เป็นฐาน 16
bin(35)             # แปลง 35 ฐานสิบ ให้เป็นฐาน 2
```

In [15]:
#int('11100111', 2)

#### Exercise
จงแสดงการแปลงตัวเลขฐานสองต่อไปนี้เป็นจำนวนเต็ม
* 10011001
* 00010011
* 00011111

### Binary $\rightarrow$ Float
กำหนดตำแหน่งที่เลขสองกำลังเป็นศูนย์ (fix-point representation)

|      |      |      |      |      |      |      |      |
|------|------|------|------|------|------|------|------|
|   1  |   1  |   1  |   0  |   0  |   1  |   1  |   1  |
|$2^5$ |$2^4$ |$2^3$ |$2^2$ |$2^1$ |$2^0$ |$2^-1$ |$2^-2$ |

$1\times 2^5+1\times 2^4+1\times 2^3+0\times 2^2+9\times 2^1+1\times 2^0+1\times 2^{-1}+1\times 2^{-2}$

$1\times2^5 + 1\times2^4 + 1\times2^3 +0\times 2^2+0\times2^1+1\times 1+\frac{1}{2}+\frac{1}{4}$

$32 + 16 + 8 + 0 + 0 + 1 + 0.5 + 0.25$

**Answer**
> 57.75

In [26]:
#1*2**5 + 1*2**4 + 1*2**3 + 0*2**2 + 0*2**1 + 1*2**0 + 1*2**(-1) + 1*2**(-2)

#### Binary Fixed-Point Arithmetic
|      |      |      |      |      |      |      |      |      |
|------|------|------|------|------|------|------|------|------|
|   1  |   1  |   1  | ...  |   0  |  0  |   ...  |   1  |   1  |
| sign ||$2^{m-1}$ |$2^{m-2}$ | ... |$2^0$ |$2^{-1}$ | ... |$2^{-n+1}$ |$2^{-n}$ |

* Parameters: $m, n \in Z$
* $m$ ความยาวของสาย(จำนวน bit) ที่ใช้เป็นจำนวนเต็ม(integer portion)
* $n$ ความยาวของสาย(จำนวน bit) ที่ใช้เป็นตัวหาร(fractional portion)
* ความยาวทั้งหมดของสายเป็น $m+n+1$ รวมกับ bit ที่ใช้บอกเครื่องหมาย (+/-)
* ความรู้เพิ่มเติม: [Fixed-Point Numbers](https://en.wikibooks.org/wiki/Floating_Point/Fixed-Point_Numbers)

# Error in Binary Fixed-Point Arithmetic

** สมมติว่ามีแค่ 2 bit ให้ใช้ ** 

> $m = 1, n=1$ โดยที่ไม่คิด sign bit

$0.1 \times 0.1 = 0.01 \approx 0.0$ 


# Binary Floating-Point Arithmetic
1. IEEE single precision format

|  0   |     1-8       |       9-31        |
|:----:|:-------------:|:-----------------:|
| $s$  |      $e$      |        $f$        |
| $0$  |   $00001001$  |   $0011011...01$  |

$ = (-1)^s \times 2^{e-127} \times 1.f $

โดยที่
 * **sign** $s \in {0, 1}$
 * **biased exponent** $0 \le e \le 255$
 * **exponent** $p=e-127$ so $-126 \le p \le 127$
 * **significand** $1.f$ 

# Binary Floating-Point Arithmetic 
2. IEEE double precision format

|  0   |     1-11      |       12-63       |
|:----:|:-------------:|:-----------------:|
| $s$  |      $e$      |        $f$        |
| $0$  | $00001000111$ |   $0011011...01$  |

$ = (-1)^s \times 2^{e-1023} \times 1.f $

โดยที่
 * **sign** $s \in {0, 1}$
 * **biased exponent** $0 \le e \le 2047$
 * **exponent** $p=e-1023$ so $-1022 \le p \le 1024$
 * **significand** $x = 1.f$ 

# Example 

จงเขียนคำสั่งเพื่อหาค่าของตัวเลขตามข้อต่อกำหนดต่อไปนี้ โดยใช้ IEEE single precision format
> 0 1111 0000 0000 1010 0000 0000 0000 000
 
**Answer** 
หาค่า $s, e, f$ จากโจทย์
> $s = 0$

> $e$ = 11110000

> $f$ = 0000101 

```python
s = 0
e = int('11110000', 2)
x = 1 + 0*2**(-1) + 0*2**(-2) + 0*2**(-3) + 0*2**(-4) + 1*2**(-5) + 0*2**(-6) + 1*2**(-7)
print( (-1)**s * 2**(e-127) * x )
```

# Exercise 
1. จงเขียนคำสั่งเพื่อหาค่าของตัวเลขตามข้อต่อกำหนดต่อไปนี้ โดยใช้ IEEE single precision format
 * $s = 0$
 * $e$ = 1111 0000 0000
 * $f$ = 0000 1010 
 
2. จงเขียนคำสั่งเพื่อหาค่าของตัวเลขตามข้อต่อกำหนดต่อไปนี้ โดยใช้ IEEE double precision format
 * $s = 1$
 * $e$ = 0000 0011 0000
 * $f$ = 0110 1010 


# Error Calculation

* **Absolute Error** 
    $\rightarrow E_{abs} = \| x_0 - x \|$
* **Relative Error**
    $\rightarrow E_{rel} = \frac { E_{abs} }{x} $
* **Percentage Error**
    $\rightarrow E_{per} = E_{rel} \times 100$