ترميز زوج البايتات

ترميز زوجين من البايت (بالإنجليزية: Byte Pair Encoding)‏ هو نموذج بسيط لضغط البيانات يقوم بستبدال زوجين من البايت على التوالي وأكثرهما شيوعاً ببايت واحد بحيث لا يتكرر البايت المستبدل في مجموعة البيانات.[1][2] الزواج المستبدل يوضع في جدول لكي يتم إعادة بناء البيانات الأصلية.

مثال

لنفترض أننا نريد لترميز البيانات التالية:

aaabaaabac

زوجان aa يتكرران في معظم الأحيان لذلك سوف يتم استبداله بالبايت Z والذي لم يظهر في البيانات. والآن نضع البايت Z في جدول استبدال.

Z <- aa

ويعاد ترميز البيانات نحو التالي:

ZabZabac

بعد ترميز البيانات يظهر الزوجين Za بشكل مستمر لذلك سوف يتم استبدال بايت Y

Z <- aa
 Y <- Za
YbYbac

مرة أخرى نستبدال الزوجين الأكثر شيوعاً.

Z <- aa
Y <- Za
X <- Yb
W <- XX
 Wac

حتي نصل إلى مرحلة يستحيل ضغط البيانات بسبب عدم وجود أزواج من البايتات متكرره.

مراجع

  1. "Dr Dobbs Journal"، مؤرشف من الأصل في 14 ديسمبر 2019.
  2. "Byte Pair Encoding"، مؤرشف من الأصل في 17 فبراير 2017.
  • بوابة تقانة
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.