Bölüm 2: MIMO kapasite formülü Kablosuz Haberleşme Bölüm 2: MIMO kapasite formülü
Giriş ‘Haberleşmenin matematiksel bir teoremi’, Claude Shannon, 1948 - Bilgi teoreminin temel kavramları - Bir haberleşme sistemi üzerinden hatasız iletilebilecek maksimum teorik veri hızının ifadesi - Maksimum veri hızı = haberleşme kapasitesi - SISO sistem için haberleşme kapasitesinin hesaplanması ‘Çok antenli Gauss Kanallarının Kapasitesi’, Emre Telatar, 1999 - MIMO sisteminin teorik kapasitesinin ifadesi
2.1 Bilgi Nedir? Bir haberleşme sisteminin kapasitesi birim zamanda bir haberleşme kanalı üzerinden iki nokta arasında iletilen maksimum bilgi miktarı Kapasiteyi sayısal olarak belirleyebilmek için bilginin matematiksel tanımına ihtiyaç var.
İfade 1: Bu sabah Alaska’da kar yağdı. İfade 2: Bu sabah Porto Riko’da kar yağdı. Gerçekleşme olasılığı daha düşük bir olayın gerçekleştiğini duyduğumuzda daha çok bilgi ediniriz. İfade 3: Bugün hem Alaska’da hem de Porto Riko’da kar yağdı. İfade 3’teki bilgi miktarı = İfade 1’deki bilgi miktarı + İfade 2’deki bilgi miktarı Bilginin, günlük konuşmadan yapılan çıkarımlara dayanan özellikleri: - Özellik 1: Gerçekleşme ihtimali olmayan olayları içeren ifadeler, gerçekleşme ihtimali olan olayları içeren ifadelere göre daha çok bilgi içerir. - Özellik 2: Bilgi toplanabilirdir. - Bu iki özelliğe dayanarak bilginin matematiksel ifadesi oluşturulabilir.
Önsel olasılığı p olan bir olay düşünelim. Bu olayın gerçekleştiğini öğrendiğimizde iletilen bilgi miktarı, 𝐼 𝑝 = log 1 𝑝 =− log 𝑝 İfade 1’i tanımlar (Özellik 1’i sağlar). Önsel olasılıkları p1 ve p2 olan iki bağımsız olay düşünelim. İki olayın da gerçekleşme olasılığı 𝑝1,2=𝑝1𝑝2 . İki olayın da gerçekleştiğni öğrendiğimizde iletilen bilgi miktarı, 𝐼 𝑝 1,2 = log 1 𝑝 1,2 = log 1 𝑝 1 𝑝 2 = log 1 𝑝 1 + log 1 𝑝 2 =𝐼 𝑝 1 +𝐼( 𝑝 2 ) İfade 2’yi tanımlar (bağımsız olaylar için özellik 2’yi sağlar). Log ifadesinde 2 bazı kullanıldığında bilginin birimi bit, e bazı kullanıldığında bilginin birimi nat olur.
2.2 Entropi X rasgele değişkeni x1, x2... değerlerini alabilir. X = xi olayı ile bağdaştırılan bilgi, I(xi) = -logp(xi) p(xi) = Prob[X=xi] Belirli bir rasgele değişken ile bağdaştırılan ortalama bilgi entropidir. Entropi = 𝐻 𝑋 ≜𝐸𝑋 𝐼(𝑋) , = E X − log 𝑝(𝑋) , = − 𝑖 𝑝𝑋( 𝑥 𝑖 ) log 𝑝𝑋( 𝑥 𝑖 ).
Örnek: X rasgele değişkeninin belirsizliği yoktur. Entropi = rasgele değişkenin değeri hakkında sahip olduğumuz bilginin kesin olmayışının ölçüsü. Örnek: X rasgele değişkeninin belirsizliği yoktur. ( p(x0)=1 ve diğer bütün X değerlerinde p(xi)=0) H(X)= -px(x0)logpx(x0)=-1*log(1)=0 => belirsizlik yok. Örnek: Maksimum belirsizlik 𝑝 𝑋 𝑥 𝑖 = 1 𝑁 , ∀𝑖 Bağıl entropi 𝐻 𝑌 𝑋 =− 𝑥,𝑦 𝑝(𝑥,𝑦) log 𝑝 𝑋,𝑌 𝑦 𝑥 .
2.3 Karşılıklı Bilgi Bir haberleşme kanalında çıktı, olasılıksal bir biçimde girdiye bağlıdır. Eğer kanalın girdisi xi ise kanalın çıktısı yi , kanalın özelliklerine göre farklı değerler alabilir; fakat alacağı değer kesin olarak bilinemez. Eğer çıktıdaki sembol Y=yi ise, X=xi olayı ile ilgili ne kadar bilgi edinilmiştir? Edinilen bilgiye Karşılıklı Bilgi denir ( I(xi;yi) ) : 𝐼 𝑥 𝑖 ; 𝑦 𝑖 ≜log 𝑝 𝑥 𝑖 𝑦 𝑖 𝑝 𝑥 𝑖
𝐼 𝑥 𝑖 𝑦 𝑖 =𝐼 𝑥 𝑖 =− log 𝑝 𝑋 ( 𝑥 𝑖 ) Örnek 2.1: X ve Y’nin istatiksel bağımsız rasgele değişkenler olduğunu varsayalım. Alınan sembolün iletilen sembolle ilgili bilgi taşımaması beklenir, yani karşılıklı bilgi 0 olmalıdır. 𝑝 𝑥 𝑖 𝑦 𝑖 = 𝑝 𝑥 𝑖 𝐼 𝑥 𝑖 ; 𝑦 𝑖 = log 𝑝 𝑥 𝑖 𝑝 𝑥 𝑖 = 0 Örnek 2.2: Y=yi’nin X=xi’yi özebir belirlediğini düşünelim. Yani alınan sembolü biliyorsak, iletilen sembolü de otomatik olarak biliyoruz. Bu durumda, Y=yi olayından X=xi olayı ile ilgili öğrendiğimiz bilgi X=xi olayı ile ilgili bilgidir. Karşılıklı bilgi, I(xi)’ye eşittir. 𝑝 𝑥 𝑖 𝑦 𝑖 = 1 𝐼 𝑥 𝑖 𝑦 𝑖 =𝐼 𝑥 𝑖 =− log 𝑝 𝑋 ( 𝑥 𝑖 )
X ve Y rasgele değişkenleri arasındaki ortalama karşılıklı bilgi: 𝐼 𝑋;𝑌 = 𝐸 𝑥,𝑦 𝑙𝑜𝑔 𝑝 𝑥 𝑦 𝑝(𝑥) = 𝑥,𝑦 𝑝(𝑥,𝑦) log 𝑝 𝑥 𝑦 𝑝(𝑥) I(X;Y)’nin özellikleri: Teorem 2.1 Ortalama karşılıklı bilgi değişme özelliğine sahiptir 𝐼 𝑋;𝑌 =𝐼 𝑌;𝑋 𝐼 𝑋;𝑌 = 𝑥,𝑦 𝑝(𝑥,𝑦) log 𝑝 𝑥 𝑦 𝑝(𝑥) = 𝑥,𝑦 𝑝(𝑥,𝑦) log 𝑝 𝑥,𝑦 𝑝 𝑥 𝑝(𝑦) Bu ifade x ve y’ye göre simetriktir Teorem 2.2: X ve Y rasgele değişkenleri arasındaki ortalama karşılıklı bilgi, bu değişkenlerin entropisine bağlıdır; 𝐼 𝑋;𝑌 = 𝐻 𝑋 −𝐻 𝑋 𝑌 = 𝐻 𝑌 −𝐻 𝑌 𝑋 H 𝑌 𝑋 ≜− 𝑥,𝑦 𝑝(𝑥,𝑦) log 𝑥 𝑦 = − 𝑥,𝑦 𝑝(𝑥,𝑦) log 𝑦 𝑥 İspat:
2.4 SISO Kapasite Tanımı X haberleşme kanalının girdisi ve Y de çıktısı olarak görülürse 𝐶 ≜ max 𝑝𝑥(𝑥) 𝐼(𝑋;𝑌) Kısıtlar 0≤ 𝑝 𝑋 (𝑥)≤1 𝑥 𝑝𝑋 𝑥 =1
2.5 MIMO Kapasitesinin Tanımı MIMO sistem modeli: - Dar bant sinyal varsayılarak oluşturulmuştur. - Parametreler: hij -> j’inci iletici anteni ve i’inci alıcı anteni arasındaki kanal cevabı ri -> i’inci alıcı antende alınan sinyal sj -> j’inci iletici antenden iletilen sembol zi -> i’inci alıcı antendeki gürültü sinyali
2.5 MIMO Kapasitesinin Tanımı Alıcı antenlerdeki sinyaller 𝑟𝑖= 𝑗=1 𝑁𝑡 ℎ𝑖𝑗𝑠𝑗+ 𝑧 𝑖 i= 1, ....., Nr Matris formunda; r = Hs + z z ≜ 𝑧1, …, 𝑧 𝑁 𝑟 𝑇 s ≜ 𝑠1, …, 𝑠 𝑁 𝑡 𝑇 r ≜ 𝑟1,… 𝑟 𝑁 𝑟 𝑇 H ≜ ℎ 1,1 ⋯ ℎ 1, 𝑁 𝑡 ⋮ ⋱ ⋮ ℎ 𝑁 𝑟 ,1 ⋯ ℎ 𝑁 𝑟 , 𝑁 𝑡 H’nin boyutlarının yerleri değiştirildiğinde (Nt x Nr); r =sH + z r,s ve z vektörleri sütun vektörleri yerine satır vektörleri oluyorlar.
Kapasite (s yerine X, r yerine Y): 𝐶 ≜ max 𝑝𝑥(𝑥) 𝐼(𝑋;𝑌) I(X;Y) = H(X) – H(X|Y) = H(Y) - H(Y|X) -> X yerine s ve Y yerine r konulduğunda; 𝐶𝑀𝐼𝑀𝑂= max 𝑝𝑠 𝑠1,…, 𝑠 𝑁 𝑡 𝐻 𝐫 −𝐻(𝐫|𝐬) r = Hs + z →𝐻 𝐫 𝐬 =𝐻(𝐇𝐬+𝐳|𝐬) Belirli bir kanal matrisi için H ve Hs sabittir. 𝐻 𝐫 𝐬 ‘teki tek rasgele değişkenlik gürültü terimi z’ye bağlıdır. Böylece 𝐻 𝐫 𝐬 = 𝐻 𝐇𝐬+𝐳 𝐬 =H(z) olur 𝐶𝑀𝐼𝑀𝑂= max 𝑝𝑠 𝑠1,…, 𝑠 𝑁 𝑡 𝐻 𝐫 −𝐻(𝐳)
2.6 H(z)’nin Hesaplanması H(z)’deki bütün z elemanlarının birbirinden bağımsız olduğu varsayılarak; 𝑝 𝒁 𝒛 = 1 2𝜋 𝑁 𝑟 𝐑 zz 1 2 𝑒 − 1 2 𝒛−µ 𝑇 𝐑 zz −1 𝒛−µ µ≜𝐸 𝑧 z’nin ortalaması 𝐑 𝑧𝑧 : Rzz’nin determinantı 𝐑 𝑧𝑧 :z’nin kovaryans matrisi 𝐑 𝑧𝑧 ≜𝐸 𝒛−µ 𝒛−µ 𝑇 . Gürültü terimleri bağımsız olduğu için; 𝐑 𝑧𝑧 = 𝜎 2 𝐈 N 𝐫 𝐈 x x satırlı x sütunlu birim matris 𝐳 ~𝒩 𝛍, 𝐑 𝑧𝑧 yerine 𝐳~𝒩 𝟎, 𝐑 𝑧𝑧 alınıyor.
Kapasitenin türetilmesi (kolaylık için doğal logaritma kullanalım): Varsayım: alıcı antenle2rdeki gürültüler bağımsız 𝐑 zz = σ 2 𝐈 N r H 𝐳 =−𝐸 ln𝑝𝒛(𝒛) H 𝐳 =E − 1 2 𝐳−𝛍 T 𝐑 zz −1 𝐳−𝛍 −ln 2π N r 𝐑 zz 1 2 = 1 2 E i,j z i − μ i 𝐑 zz −1 ij z j − μ j + 1 2 ln 2π N r 𝐑 zz = 1 2 i,j E z j − μ j z i − μ i 𝐑 zz −1 ij + 1 2 ln 2π N r 𝐑 zz = 1 2 i,j 𝐑 zz ji 𝐑 zz −1 ij + 1 2 ln 2π N r 𝐑 zz = 1 2 i 𝐑 zz 𝐑 zz −1 ii + 1 2 ln 2π N r 𝐑 zz = 1 2 i 𝐈 ii + 1 2 ln 2π N r 𝐑 zz = N r 2 + 1 2 ln 2π N r 𝐑 zz = N r 2 ln e + 1 2 ln 2π N r 𝐑 zz = 1 2 ln 2πe N r 𝐑 zz nats = 1 2 log 2 2πe N r 𝐑 zz bits = N r 2 log 2 2πe + 1 2 log 2 𝐑 zz bits Sonuç: H 𝐳 = N r 2 log 2 2πe + 1 2 log 2 σ 2 𝐈 N r
2.7 H(r)’nin Hesaplanması Theorem 2.3: Entropy maximizing theorem (EMT): - x gerçek değerli rasgele vektör ve E 𝐱 =0 ve 𝐑 𝑥𝑥 = 𝐱𝐱 𝑇 ise, 𝐱 ~𝒩 𝟎, 𝐑 𝑥𝑥 olduğunda H(x) maksimize olur. Rxx: covariance matrisi 𝐫 ~𝒩 𝟎, 𝐑 𝑟𝑟 olduğunda H(r) maksimize oluyor. r ile z aynı dağılıma sahip. Sadece r’nin covariance matrisi Rzz yerine Rrr oluyor. 𝑚𝑎𝑥 𝐻(𝐫) = 𝑁 𝑟 2 log 2 2πe + 1 2 log 2 𝐑 𝑟𝑟 𝑏𝑖𝑡. olur
𝑚𝑎𝑥 𝐻(𝐫) = 𝑁 𝑟 2 log 2 2πe + 1 2 log 2 𝐑 𝑟𝑟 𝑏𝑖𝑡. 𝐑 𝑟𝑟 ≜E 𝐫− µ r 𝐫− µ r T =E 𝐫𝐫 T =E 𝐇𝐬+𝐳 𝐇𝐬+𝐳 T =E 𝐇𝐬+𝐳 𝐬 T 𝐇 T + 𝐳 T =E 𝐇𝐬𝐬 T 𝐇 T + 𝐇𝐬𝐳 T +𝐳 𝐬 T 𝐇 T + 𝐳𝐳 T =𝐇 𝐑 𝑠𝑠 𝐇 T + σ 2 𝐈 N r 𝑚𝑎𝑥 𝐻(𝐫) = 𝑁 𝑟 2 log 2 2πe + 1 2 log 2 𝐇 𝐑 𝑠𝑠 𝐇 T + σ 2 𝐈 N r 𝑏𝑖𝑡.
2.8 Sonuç Gerçel sinyaller için kapasite: 𝐶 𝑟𝑒𝑎𝑙 =𝑚𝑎𝑥 𝐻 𝐫 −𝐻(𝐳) = 1 2 log 2 𝐇𝐑 𝑠𝑠 𝐇 T + σ 2 𝐈 − 1 2 log 2 σ 2 𝐈 = 1 2 log 2 𝐇 𝐑 𝑠𝑠 𝐇 T + σ 2 𝐈 σ 2 I = 1 2 log 2 𝐇 𝐑 𝑠𝑠 𝐇 T + σ 2 𝐈 σ 2 𝐈 𝑰 =1 𝐶 𝑟𝑒𝑎𝑙 = 1 2 log 2 𝐈+ 1 σ 2 𝐇 𝐑 𝑠𝑠 𝐇 T 𝑏𝑖𝑡𝑠 𝑝𝑒𝑟 𝑐ℎ𝑎𝑛𝑛𝑒𝑙 𝑢𝑠𝑒
Bit/sn cinsinden kapasite nedir? Bant genişliği W ve süresi T olan bant-sınırlı bir sinyal düşünelim. Nyquist örneklemesi teoremine göre bu sinyal 2TW bağımsız örnekle ifade edilebilir. Bu sinyali T saniyede 2TW örnek kullanarak iletebiliriz. ( 2W iletim/saniye) Her iletim, Creal kadar bilgiyi transfer ediyor. -> Creal x 2W bit/saniye 𝐶 𝑟𝑒𝑎𝑙 = 𝑊 log 2 𝐈+ 1 σ 2 𝐇 𝐑 𝑠𝑠 𝐇 T 𝑏𝑖𝑡/𝑠𝑎𝑛𝑖𝑦𝑒
2.8.2: Karmaşık sinyaller için kapasite: Karmaşık sinyaller, karmaşık ve gerçek bileşenlerden oluştukları için gerçek sinyallere göre 2 kat daha fazla kapasiteye sahiptirler. Kapasite formülünde HT yerine HH gelmelidir. (Telatar) 𝐶 𝑐𝑜𝑚𝑝𝑙𝑒𝑥 = log 2 𝐈+ 1 σ 2 𝐇 𝐑 𝑠𝑠 𝐇 H 𝑏𝑖𝑡𝑠 𝑐ℎ𝑎𝑛𝑛𝑒𝑙 𝑢𝑠𝑒 𝐶 𝑐𝑜𝑚𝑝𝑙𝑒𝑥 = 2𝑊 log 2 𝐈+ 1 σ 2 𝐇 𝐑 𝑠𝑠 𝐇 H 𝑏𝑖𝑡𝑠/𝑠𝑒𝑐. MIMO sistemlerde kullanılan sinyallerin çoğunluğu karmaşıktır. Dolayısıyla bu slayttaki kapasite ifadeleri kullanılacak.