ریشهیابی، واژهای با دو کاربرد متمایز و در عین حال مرتبط است که هر یک در بستر خاص خود اهمیت بسزایی دارند. در معنای عام و گستردهتر، ریشهیابی به فرآیند جستجو و کشف خاستگاه، اصل، یا منشأ یک پدیده، ایده، مفهوم، یا حتی یک شیء اطلاق میگردد. این کاربرد، در حوزههای متنوعی از علوم انسانی گرفته تا علوم طبیعی، به منظور درک عمیقتر از چگونگی شکلگیری و تکامل امور به کار گرفته میشود و بنیانی برای تحلیلهای بیشتر فراهم میآورد.
در حوزه تخصصیتر پردازش زبان طبیعی (NLP) و زبانشناسی محاسباتی، ریشهیابی (Stemming) یا ریشهشناسی (Etymology) به رویکردی مشخص برای سادهسازی و استانداردسازی واژگان میپردازد. هدف اصلی در این کاربرد، تقلیل اشکال گوناگون یک کلمه به ریشه اصلی یا پایه آن است؛ به این معنا که با حذف پیشوندها، پسوندها، و سایر وندها، به هسته معنایی یا دستوری کلمه دست یابیم. این فرآیند به شناسایی واژههای همخانواده و بازیابی اطلاعات موثرتر در سامانههای جستجو و تحلیل متون کمک شایانی میکند.