📄 النص الكامل للصفحة
وأخيرًا، ستُستخدم طريقة تضمين المجاور العشوائي الموزع على شكل T (T-SNE) لتخفيض التضمينات ذات الـ 300 بعد للكلمات في العينة ضمن النقاط ثنائية الأبعاد. بعدها، تُمثل النقاط في مخطط انتشار بسيط.--- SECTION: شكل 3.22: تمثيل الكلمات الأكثر تكراراً من مجموعة بيانات هيئة الإذاعة البريطانية --- شكل 3.22: تمثيل الكلمات الأكثر تكراراً من مجموعة بيانات هيئة الإذاعة البريطانية يُثبت المخطط أن تضمينات نموذج الكلمة إلى المتجه (Word2Vec) تستنبط الارتباطات الدلالية بين الكلمات، كما يتضح من مجموعات الكلمات الواضحة مثل:
• economy (الاقتصاد)، economic (الاقتصادية)، business (الأعمال)، financial (المالية)، sales (المبيعات)، bank (المصرف)، firm (الشركة)، firms (الشركات).
• Internet (الإنترنت)، mobile (الهاتف المحمول)، phones (الهواتف)، phone (الهاتف)، broadband (النطاق العريض)، online (متصل)، digital (رقمي).
• actor (ممثل)، actress (ممثلة)، film (فيلم)، comedy (كوميدي)، films (أفلام)، festival (مهرجان)، band (فرقة)، movie (فيلم).
• game (لعبة)، team (فريق)، match (مباراة)، players (لاعبون)، coach (مدرب)، injury (إصابة)، club (نادي)، rugby (الرجبي).2023 - 1447--- VISUAL CONTEXT ---
**DIAGRAM**: تمثيل الكلمات الأكثر تكراراً من مجموعة بيانات هيئة الإذاعة البريطانية
Description: A 2D scatter plot (word cloud) generated using t-SNE to visualize 300-dimensional word embeddings from the BBC dataset. Semantically related words are clustered together, demonstrating the effectiveness of Word2Vec in capturing semantic relationships. Clusters include words related to sports, politics, finance, technology, and entertainment.
Table Structure:
Headers: N/A Rows:
X-axis: N/A Y-axis: N/A Data: The diagram shows various English words plotted in a 2D space. Words that are semantically similar are grouped closely together, forming distinct clusters. For example, 'actor', 'actress', 'film', 'movie' form one cluster, while 'bank', 'economy', 'financial' form another. Other clusters include words related to sports (rugby, team, game), politics (president, minister, government), and technology (phone, internet, digital).
Key Values: moviemedy, films, festival, tv, online, broadband, video, internet, digital, mobile, phones, phone, technology, computer, data, information, system, services, service, companies, firm, firms, sales, stock, shares, prices, bank, market, economic, growth, economy, tax, financial, business, general, government, action, public, told, says, made, make, said, security, spokesman, president, chancellor, tony, chief, director, leader, police, secretary, minister, analysts, award, awards, prize, oscar, actor, actress, singer, stars, star, win, matches, game, players, rugby, team, coach, club, cup, net, china, deal, best, expected, great, good, us, uk, bbc, france, england, british, chelsea, lord, blair, tories, brown, mps, people, used, using, users, years, group, campaign, prime, months, million, year, final, half, second, series, two, six, time, back, home, number, words, going, like, think, get, how, ever, state, country, added, next, old, top, injury, dollar, party, set, open, world, law, well, could, way, what, new, one, first, last, day, week, month, year, life, work, play, show, season, chart, however, rise Context: This diagram illustrates how high-dimensional word embeddings (Word2Vec) can be reduced to two dimensions using t-SNE for visualization, revealing semantic relationships between words in a dataset. It demonstrates the concept of word similarity in a visual manner.