Tech黑手 - 工作雜記: 06/01/2012

2012年6月28日星期四

I2S (Inter-IC Sound)

From http://jackho1977.blogspot.tw/2007/12/i2s.html

與I2C字樣與含意相近的，I2S的全稱是Inter-IC Sound，意指在晶片間傳遞的音源，至於會有哪些晶片需要相互傳遞數位音源，這包括了數位信號處理器（DSP）、類比數位轉換晶片（ADC）、數位類比轉換晶片（DAC）、數位過濾晶片（Digital Filter）、CD更錯晶片（Error Correction）、數位錄音晶片（Digital Recording）、數位電視音源晶片（Digital TV）、數位錄音帶（Digital Audio Tape）等，另外全球定位系統晶片（GPS）、數位廣播晶片（DAB）等也經常用上，或者SPDIF與I2S兩種介面都提供，前者適合外傳、外接，後者方便數位音源在機內進行再傳遞、再轉換、再處理。

簡單而言I2S有3條線路，稱呼與功用大體如下：

■SCK（continuous Serial Clock）：串列傳輸的時脈線，專精、獨立的時脈傳遞。
■SD（Serial Data）：串列傳輸的資料線，傳遞兩個聲道的數位音源資訊。
■WS（Word Select）：字元選擇線，字元（Word）在此所指即是音源聲道（Channel）。

這3條線路的邏輯電壓準位等相關要求，全然比照一般TTL標準，即0V∼0.8V為Lo、2.4∼5.0V為Hi，就連源出（Source）與汲入（Sink）的電流值標準也類同於TTL，事實上I2S本就發創於標準TTL仍相當盛行的80年代，因此電氣特性的表現過於「基本」自然不足為怪。

接著我們要說明I2S的連接，一般而言I2S是一對一的連接，即音源發送端與音源接收端直接相連，且SD的資料傳輸永為單一方向不會改變，並非是雙向式傳輸。進一步的，到底由誰來發送SCK時脈呢？無論發送端或接收端都可擔任，不過必須在設計之初就決定由哪端發出，且在運作過程中無法再行變換。

同樣的，WS聲道控制線路也要一起頭就決定由誰來輸出，當WS輸出0時表示SD將要輸出的是Channel 1（或稱Channel A）的左聲道音源，反之輸出1則是Channel 2（或稱Channel B）的右聲道音源。簡單來說，3線都是單方單向的傳遞線路。

雖然在I2S介面上有收有發，但誰是I2S介面的主控者（Master）、受控者（Slave）呢？這取決於線路的配置法，凡是對外輸出SCK線路訊號的即是I2S的主控者，至於SD、WS在設計上可決定由主控端發送，也可決定由受控端發送，毫不影響主控、受控的角色。

另外也有一種比較特別的搭配組態，即是由一個超然中立的控制端來充當主控者，由它來廣播SCK時脈訊號，同時也由其來掌控及發送WS訊號。

附註：一般而言主控者選擇擔任發送端後就無法擔任接收端，或擔任接收端後就無法擔任接收端，不過若真的希望角色能互換，也是允許用軟體對接腳進行輸出入功用的再設定、轉換來實現。

▲圖說：誰負責SCK的對外發送，誰就是I2S介面中的主控者，無論發送器、接收器、控制器都可以是主控者。（圖片來源：Semiconductors.Philips.com）

刻意安排先行傳輸MSB的用意

接著我們要說明收端兩端如何傳遞SD資訊，此即是以SCK時脈為基準，當SCK由Lo轉成Hi（即上升緣觸發）時，發送端的SD資訊就會被接收端給閂鎖（Latch）。一旦Latch後，下一筆資料可選擇在任何時間進行變換，I2S對資料的變換時機沒有強制的要求。至於WS，一樣可在任何時間進行變化，但接收端的取樣與資訊認定一樣發生在上升緣觸發的時間點。

值得注意的是，WS的0、1狀態轉變時，同一上升緣的SD資訊依然是WS未轉態前的聲道資訊，確定WS狀態轉變後，下一個上升緣時SD線路才正式傳輸WS新指定聲道的音源資訊，畢竟接收端在接獲聲道變換的訊息後，需要一點時間進行內部邏輯機制的調整與準備，無法即時接收反應。

再來是壓軸部分：SD的數位音源傳輸，SD的串列傳輸順序是先傳遞最高位元（MSB，亦稱最高影響性位元），最後才傳遞LSB，或許有人認為這只是設定安排上的不同，應當也可以將順序反過來傳遞，但其實不然，以MSB為最優先傳送實有其充分理由。

I2S希望做到收發兩端不需任何的事先溝通協議就能正常進行傳遞，而所謂事先協議指的是讓兩端取得默契，如接下來的傳輸將是每聲道、每取樣多少位元解析度的資訊，是16-bit？20-bit？還是24-bit？

I2S之所以能不用事先溝通就可以直接傳送，就在於使用MSB先傳的特性，如果發送端是20-bit，接收端是更高解析度的24-bit，那麼傳送完20bits後的剩餘4bits可以由接收端自行補「0」，反過來說，若接收端只有16-bit，則傳送過來的20bits中，最後的4bits資訊可以直接丟捨忽略。同樣的道理並不限於上面所述的16-bit、20-bit、24-bit，只要有解析度位元數差距的情形都一律適用。

▲圖說：I2S在進行WS邏輯位準的改變後，SD便在下一個SCK時脈時開始傳輸另一聲道的數位音訊，並從MSB開始傳遞。（圖片來源：Semiconductors.Philips.com）

至於I2S可以含在多少音源資訊？以基本規範而言，一個時脈400nS，因此傳輸頻率為2.5MHz，等於可傳送2.5Mbps，如此約可傳遞24-bit解析度、48kHz取樣率的雙聲道音源，因為：

24bits x 48000Hz x 2Channel = 2304000bits/Sec = 2.304Mbps

2.5Mbps減去2.304Mbps後，只剩200kbps不到的傳輸頻寬，實在無法再傳遞什麼。不過，由於I2S在時序上的制訂都盡可能採行相對性、比例性的定義，以一個時脈週期為基準並稱為T，高低準位的時間最少須大於0.35T，延遲時間必須小於0.8T，上升時間必須大於0.15T等，這表示整個傳輸可以單純地透過時脈頻率拉升來加速資料傳量，不需要為提昇傳輸而有太多的環節顧慮。

附註：一般音樂CD的解析度為16-bit，取樣率為44.1kHz，但也可增至更優質的20-bit、24-bit，而專業的DAT其取樣率為48kHz，而DSR稍低，為32kHz。

▲圖說：I2S介面對時序的規範要求都盡可能採行相對性、比例性的設計，以SCK的一個時脈週期為T，其餘相關要求都以T為基準比例。（圖片來源：Semiconductors.Philips.com）

結論

在今日大談5.1、6.1的多聲道時代，以及Intel提出解析度高達32-bit的高清晰度音效（HD Audio）的時代，各位可能會對筆者在此所談論的雙聲道、24-bit感到不耐，然各位仔細想，眼前可有解析度高達32-bit的錄音麥克風？即便有可有任何音樂內容是以32-bit取樣錄製？（18-bit已是極優）很明顯的，24-bit依舊是萬中挑一的嚴選，一般多為16-bit、20-bit，就連DVD-Audio、SACD等也僅在24-bit。

另外5.1、6.1的多聲道，也僅適合在打造家庭劇院，狹小、個人專用的書房空間並不合適，且只有一人使用的情況下甜蜜區（Sweet Spot）不需太大，用2.1的喇叭組態便能營造足夠的方位音效感，至於真正要如電影般的大範圍甜蜜區佈建，就要動用如SDDS（Sony Dynamic Digital Sound）的7.1組態，一般5.1也辦不到。

況且，在外出時的個人使用，或在車內等場合也不能用多聲道，除非是林肯級座車才有可能，一般房車休旅車同樣是雙聲道即足夠，而在隨身用、車用電子、DAB/DVB/DMB（數位音訊、視訊、多媒體資訊廣播）、GPS等興盛的今天，電子工程師必然要務實地對機外SPDIF、機內I2S等數位音訊介面有通透性瞭解才行。

附註：I2S之後亦有增強型規格，稱為I2S Enhanced。

▲圖說：要佈建電影院等級的大範疇方位音效甜蜜區，需動用SDDS（Sony Dynamic Digital Sound）的8聲道技術才行。（圖片來源：SDDS.com）

2012年6月25日星期一

C語言巨集定義技巧

轉載自:http://miaozl.spaces.live.com/?_c11_blogpart_blogpart=blogview&_c=blogpart&_c02_owner=1&partqs=amonth%3d2%26ayear%3d2007

C語言巨集定義技巧
1，防止一個頭檔被重複包含


#ifndef COMDEF_H

#define COMDEF_H

//頭檔內容

#endif

2，重新定義一些類型，防止由於各種平臺和編譯器的不同，而產生的類型位元組數差異，方便移植。


typedef unsigned char boolean; /* Boolean value type. */

typedef unsigned long int uint32; /* Unsigned 32 bit value */

typedef unsigned short uint16; /* Unsigned 16 bit value */

typedef unsigned char uint8; /* Unsigned 8 bit value */



typedef signed long int int32; /* Signed 32 bit value */

typedef signed short int16; /* Signed 16 bit value */

typedef signed char int8; /* Signed 8 bit value */
//下面的不建議使用

typedef unsigned char byte; /* Unsigned 8 bit value type. */

typedef unsigned short word; /* Unsinged 16 bit value type. */

typedef unsigned long dword; /* Unsigned 32 bit value type. */

typedef unsigned char uint1; /* Unsigned 8 bit value type. */

typedef unsigned short uint2; /* Unsigned 16 bit value type. */

typedef unsigned long uint4; /* Unsigned 32 bit value type. */

typedef signed char int1; /* Signed 8 bit value type. */

typedef signed short int2; /* Signed 16 bit value type. */

typedef long int int4; /* Signed 32 bit value type. */

typedef signed long sint31; /* Signed 32 bit value */

typedef signed short sint15; /* Signed 16 bit value */

typedef signed char sint7; /* Signed 8 bit value */

3，得到指定位址上的一個位元組或字


#define MEM_B( x ) ( *( (byte *) (x) ) )

#define MEM_W( x ) ( *( (word *) (x) ) )

4，求最大值和最小值


#define MAX( x, y ) ( ((x) > (y)) ? (x) : (y) )

#define MIN( x, y ) ( ((x) < (y)) ? (x) : (y) )

5，得到一個field在結構體(struct)中的偏移量


#define FPOS( type, field ) \

/*lint -e545 */ ( (dword) &(( type *) 0)-> field ) /*lint +e545 */

6,得到一個結構體中field所佔用的位元組數


#define FSIZ( type, field ) sizeof( ((type *) 0)->field )

7，按照LSB格式把兩個位元組轉化為一個Word


#define FLIPW( ray ) ( (((word) (ray)[0]) * 256) + (ray)[1] )

8，按照LSB格式把一個Word轉化為兩個位元組


#define FLOPW( ray, val ) \

(ray)[0] = ((val) / 256); \

(ray)[1] = ((val) & 0xFF)

9，得到一個變數的位址（word寬度）


#define B_PTR( var ) ( (byte *) (void *) &(var) )

#define W_PTR( var ) ( (word *) (void *) &(var) )

10，得到一個字的高位和低位元位元組


#define WORD_LO(xxx) ((byte) ((word)(xxx) & 255))

#define WORD_HI(xxx) ((byte) ((word)(xxx) >> 8))

11，返回一個比X大的最接近的8的倍數


#define RND8( x ) ((((x) + 7) / 8 ) * 8 )

12，將一個字母轉換為大寫


#define UPCASE( c ) ( ((c) >= 'a' && (c) <= 'z') ? ((c) - 0x20) : (c) )

13，判斷字元是不是10進值的數字


#define DECCHK( c ) ((c) >= '0' && (c) <= '9')

14，判斷字元是不是16進值的數字


#define HEXCHK( c ) ( ((c) >= '0' && (c) <= '9') ||\

((c) >= 'A' && (c) <= 'F') ||\

((c) >= 'a' && (c) <= 'f') )

15，防止溢出的一個方法


#define INC_SAT( val ) (val = ((val)+1 > (val)) ? (val)+1 : (val))

16，返回陣列元素的個數


#define ARR_SIZE( a ) ( sizeof( (a) ) / sizeof( (a[0]) ) )

17，返回一個無符號數n尾的值MOD_BY_POWER_OF_TWO(X,n)=X%(2^n)


#define MOD_BY_POWER_OF_TWO( val, mod_by ) \

( (dword)(val) & (dword)((mod_by)-1) )

18，對於IO空間映射在存儲空間的結構，輸入輸出處理


#define inp(port) (*((volatile byte *) (port)))

#define inpw(port) (*((volatile word *) (port)))

#define inpdw(port) (*((volatile dword *)(port)))

#define outp(port, val) (*((volatile byte *) (port)) = ((byte) (val)))

#define outpw(port, val) (*((volatile word *) (port)) = ((word) (val)))

#define outpdw(port, val) (*((volatile dword *) (port)) = ((dword) (val)))

19,使用一些宏跟蹤調試

A N S I標準說明了五個預定義的宏名。它們是：


_ L I N E _

_ F I L E _

_ D A T E _

_ T I M E _

_ S T D C _

如果編譯不是標準的，則可能僅支援以上宏名中的幾個，或根本不支持。記住編譯程序

也許還提供其他預定義的宏名。

_ L I N E _及_ F I L E _巨集指令在有關# l i n e的部分中已討論，這裏討論其餘的宏名。

_ D AT E _巨集指令含有形式為月/日/年的串，表示原始檔案被翻譯到代碼時的日期。

源代碼翻譯到目標代碼的時間作為串包含在_ T I M E _中。串形式為時：分：秒。

如果實現是標準的，則宏_ S T D C _含有十進位常量1。如果它含有任何其他數，則實現是

非標準的。

可以定義宏，例如:

當定義了_DEBUG，輸出資料資訊和所在檔所在行


#ifdef _DEBUG

#define DEBUGMSG(msg,date) printf(msg);printf(“%d%d%d”,date,_LINE_,_FILE_)

#else

#define DEBUGMSG(msg,date)

#endif

20，巨集定義防止使用是錯誤

用小括弧包含。

例如：#define ADD(a,b) （a+b）

用do{}while(0)語句包含多語句防止錯誤

例如：#difne DO(a,b) a+b;\

a++;

應用時：if(….)

DO(a,b); //產生錯誤

else

解決方法: #difne DO(a,b) do{a+b;\

a++;}while(0)

宏中"#"和"##"的用法
一、一般用法
我們使用#把巨集引數變為一個字串,用##把兩個巨集引數貼合在一起.
用法:

＃i nclude
＃i nclude
using namespace std;

#define STR(s) #s
#define CONS(a,b) int(a##e##b)

int main()
{
printf(STR(vck)); // 輸出字串"vck"
printf("%d\n", CONS(2,3)); // 2e3 輸出:2000
return 0;
}

二、當巨集引數是另一個宏的時候
需要注意的是凡巨集定義裏有用'#'或'##'的地方巨集引數是不會再展開.

1, 非'#'和'##'的情況
#define TOW (2)
#define MUL(a,b) (a*b)

printf("%d*%d=%d\n", TOW, TOW, MUL(TOW,TOW));
這行的宏會被展開為：
printf("%d*%d=%d\n", (2), (2), ((2)*(2)));
MUL裏的參數TOW會被展開為(2).

2, 當有'#'或'##'的時候
#define A (2)
#define STR(s) #s
#define CONS(a,b) int(a##e##b)

printf("int max: %s\n", STR(INT_MAX)); // INT_MAX ＃i nclude
這行會被展開為：
printf("int max: %s\n", "INT_MAX");

printf("%s\n", CONS(A, A)); // compile error
這一行則是：
printf("%s\n", int(AeA));

INT_MAX和A都不會再被展開, 然而解決這個問題的方法很簡單. 加多一層中間轉換宏.
加這層巨集的用意是把所有宏的參數在這層裏全部展開, 那麼在轉換巨集裏的那一個巨集(_STR)就能得到正確的巨集引數.

#define A (2)
#define _STR(s) #s
#define STR(s) _STR(s) // 轉換宏
#define _CONS(a,b) int(a##e##b)
#define CONS(a,b) _CONS(a,b) // 轉換宏

printf("int max: %s\n", STR(INT_MAX)); // INT_MAX,int型的最大值，為一個變數＃i nclude
輸出為: int max: 0x7fffffff
STR(INT_MAX) --> _STR(0x7fffffff) 然後再轉換成字串；

printf("%d\n", CONS(A, A));
輸出為：200
CONS(A, A) --> _CONS((2), (2)) --> int((2)e(2))

三、'#'和'##'的一些應用特例
1、合併匿名變數名
#define ___ANONYMOUS1(type, var, line) type var##line
#define __ANONYMOUS0(type, line) ___ANONYMOUS1(type, _anonymous, line)
#define ANONYMOUS(type) __ANONYMOUS0(type, __LINE__)
例：ANONYMOUS(static int); 即: static int _anonymous70; 70表示該行行號；
第一層：ANONYMOUS(static int); --> __ANONYMOUS0(static int, __LINE__);
第二層： --> ___ANONYMOUS1(static int, _anonymous, 70);
第三層： --> static int _anonymous70;
即每次只能解開當前層的宏，所以__LINE__在第二層才能被解開；

2、填充結構
#define FILL(a) {a, #a}

enum IDD{OPEN, CLOSE};
typedef struct MSG{
IDD id;
const char * msg;
}MSG;

MSG _msg[] = {FILL(OPEN), FILL(CLOSE)};
相當於：
MSG _msg[] = {{OPEN, "OPEN"},
{CLOSE, "CLOSE"}};

3、記錄檔案名
#define _GET_FILE_NAME(f) #f
#define GET_FILE_NAME(f) _GET_FILE_NAME(f)
static char FILE_NAME[] = GET_FILE_NAME(__FILE__);

4、得到一個數值類型所對應的字串緩衝大小
#define _TYPE_BUF_SIZE(type) sizeof #type
#define TYPE_BUF_SIZE(type) _TYPE_BUF_SIZE(type)
char buf[TYPE_BUF_SIZE(INT_MAX)];
--> char buf[_TYPE_BUF_SIZE(0x7fffffff)];
--> char buf[sizeof "0x7fffffff"];
這裏相當於：
char buf[11];

什麼是Zero-Copy?

from:http://stenlyho.blogspot.tw/2008/08/zero-copy.html

什麼是Zero-Copy?
想要了解這個名詞是指什麼意思的話，讓我們從一個簡單的範例開始，這個範例是server讀取一個檔案，然後把檔案資料經由socket將資料傳送給client。
簡化範例程式如下：

read(file, tmp_buf, len);
write(socket, tmp_buf, len);

Figure 1的圖說明了，這兩行程式實際的運作流程。

(1)當執行read函式後，進入Kernel的syscall read()，檔案資料會經由DMA傳到Kernel管的Buffer，然後再由CPU將檔案資料搬到user buffer(tmp_buf)裏。
(2)執行write後，Kernel的syscall write()，再用CPU去把user buffer的資料搬到socket buffer裏，資料進到socket buffer後，會再經由DMA的方式將資料送出去給client。

問題分析：
從整個流程你應該會發現有一堆資料是重覆的，如果能把這些部份改掉，那就可以減少記憶體的消耗並增加效能。
以硬體的角度來看，其實是可以做到直接跳過記憶體的資料暫存的，直接把檔案資料傳到網路去，這樣子的功能是最直接最有效率的，但並不是所有的硬體都支援這種方式。

那我們是否可以減少user buffer這個部份呢？答案是肯定的，我們必需使用mmap來取代read的功能。
簡化範例程式如下：

tmp_buf = mmap(file, len);
write(socket, tmp_buf, len);

Figure 2的圖說明了，這兩行程式實際的運作流程。

(1)mmap執行後，如同read system call會將檔案資料經由DMA複製一份到kernel buffer，但不同的地方是，read()會需要把kernel buffer複製到user buffer，mmap()並不會，mmap的user buffer跟kernel buffer是同一個位置，所以mmap可以減少一次CPU copy。
(2)write()執行，把kernel buffer經由CPU複製到socket buffer，然後再經由DMA複製到client去。

問題分析：
但是使用mmap來改善並不是不需要付出代價的，當你使用mmap+write的方法時，假設同時又有另外一支程式對同一個檔案執行write時，將會引發SIGBUS的訊號，因為你執行了一個錯誤的記憶體存取，而它的預設處理行為是，系統砍掉你的程式，並且產生core dump。
當然一支網路程式不應該這麼做處理的，有兩個方式來處理這個情況：
(1)方法一：在SIGBUS訊號設置callback function，當SIGBUS出現時由這個新設置的handler來進行處理，但這種方式不好，因為它是事後去補救，並不是正規的解決方法。
(2)方法二：使用租約(lease)的方式(windows裏稱opportunistic locking機會鎖)
如：
if(fcntl(fd, F_SETSIG, RT_SIGNAL_LEASE) == -1) {
perror("kernel lease set signal");
return -1;
}
/* l_type can be F_RDLCK F_WRLCK */
if(fcntl(fd, F_SETLEASE, l_type)){
perror("kernel lease set type");
return -1;
}

更好的做法是使用sendfile函式
簡化範例程式如下：
sendfile(socket, file, len);
Figure 3的圖說明了，這行程式在Kernel 2.1版本的實際運作流程，sendfile直接取代了read/write兩個函式，並且減少了context switch的次數。

(1)sendfile執行後，檔案資料會經由DMA傳給Kernel buffer，再由CPU複製到socket buffer去
(2)再把socket buffer的資料經由DMA傳給client去，所以執行了2次DMA Copy及1次的CPU Copy，總共3次的資料複製。

問題分析：
所以到目前為止我們已看到改善了不少地方了，但還是有一份重複的資料，那就是socket buffer，這份資料是否也可以不要呢？基本上也是可行的，只要硬體提供一點點幫助是可以做到的，那就是gather(聚合)的功能，這個功能主要的目的是，待發送端不要求存放的資料位址是連續的記憶體空間，可以是分散在記憶體的各個位置。所以到了2.4的kernel以後，socket buffer的descriptor做了一些變動，以支援gather的需求，而這個功能就是Zero-Copy。
這種方式不僅僅是減少了context switch而且也減少了buffer的使用，從上層的程式來講，也不需要做任何的變動。所以程式同樣的還是底下這行
sendfile(socket, file, len);
Figure 4的圖說明了，這行程式在Kernel 2.4版本的實際運作流程

(1)sendfile執行後，檔案資料經由DMA傳給Kernel buffer，但已不會再把資料copy到socket buffer了，socket buffer只會去管有那些Kernel buffer的address及資料長度，所以圖是用apend。
(2)資料傳給client去也是用DMA的方式，但來源變成kernel buffer了。

所以就完成了，不需要CPU去搬資料，而是純DMA搬資料的Zero-Copy了。

原本資料來源：
http://www.linuxjournal.com/article/6345

測試文章：有人針對這篇文章去進行測試的實驗結果
雖然它測起來的傳輸速度似乎沒差，但應再加上CPU負載的資料及記憶體使用量去分析，如果速度一樣但CPU loading變輕，client端很多但記憶體使用量減少，那還是有很高的實用價值。
但還有個問題，網路傳輸不見得只有直接傳檔案啊，如果是傳非檔案的資料，sendfile還是適用嗎?
http://bbs.lpi-china.org/viewthread.php?tid=4292&extra=page%3D1