اصطلاح «زبانشناسی پیکرهای» یا Corpus Linguistics در علوم زبانشناسی به شاخهای گفته میشود که با استفاده از مجموعههای بزرگ و ساختیافته از متون نوشتاری یا گفتاری (پیکرهها) به بررسی جنبههای مختلف زبان میپردازد. در این روش، زبانشناسان از دادههای واقعی زبان برای تحلیل ساختارها، واژگان، قواعد دستوری، معناشناسی و کاربردهای زبانی استفاده میکنند. پیکرهها میتوانند شامل کتابها، مقالات، روزنامهها، گفتارهای ضبطشده و منابع دیجیتال باشند و معمولاً در قالب پایگاه دادههای قابل جستجو سازماندهی میشوند. زبانشناسی پیکرهای به پژوهشگران اجازه میدهد تا الگوهای زبانی، فراوانی واژهها، همآییها و تغییرات زبان را به صورت آماری و علمی بررسی کنند. این شاخه کاربرد گستردهای در آموزش زبان، پردازش زبان طبیعی، ترجمه ماشینی و توسعه فرهنگ لغات دارد. به بیان ساده، این روش زبان را از طریق «نمونههای واقعی و حجمی» مطالعه میکند، نه تنها از طریق قواعد نظری. در این حوزه، ابزارهای نرمافزاری ویژه برای جستجو، تجزیه و تحلیل آماری و استخراج اطلاعات زبانی از پیکرهها استفاده میشوند. این روش، هم در تحلیل زبان مادری و هم در تحلیل زبانهای خارجی و تخصصی کاربرد دارد و امکان بررسی دقیقتر و علمیتر زبان را فراهم میکند.
زبان شناسی پیکره ای
فرهنگستان زبان و ادب
{corpus linguistics} [زبان شناسی] شاخه ای از زبان شناسی که در آن با ایجاد پایگاه های داده ای گسترده به بررسی جنبه های مختلف زبان می پردازد