Publication: ÖSYM Fransızca Sınavlarında Kelime Sıklığı Çözümlemesi
Abstract
Yabancı dil eğitiminin en temel unsurlarından birisi kelime öğrenimi ve öğretimidir. Ancak, bir dildeki kelimelerin tamamının öğrenilmesi mümkün olmadığından öğrenilecek kelimelerin belirlenmesinde önem durumu gözetilmelidir. Önemli kelimeleri belirlemede ise en objektif kriter kullanım sayısı olup buna ilişkin tespitler kelime sıklığı çözümlemesi neticesinde yapılabilmektedir. Kelime sıklığı çözümlemesi, belirli bir metinde veya derlemde her kelimenin ne sıklıkta görüldüğünü saymak için kullanılan dilbilimsel bir yöntemdir. Bu yöntemle, kelimelerin sıklığının çözümlemesinin yapılarak hangi kelimelerin yaygın şekilde ve hangilerinin nadir şekilde kullanıldığı anlaşılmaktadır. Böylelikle, hem hedef dile hem de kullanılan derleme ilişkin çıkarımlarda bulunmak mümkün olabilmektedir. Çalışmamızda, kelime sıklığı çözümlemesi için oluşturulacak derleme esas olarak ÖSYM tarafından gerçekleştirilen Fransızca sınavlar belirlenmiştir. Bu belirlemedeki gerekçe, söz konusu sınavların ülkemizde Fransızca bilgisini ölçmek için ölçüt olarak alınmasıdır. Çalışmamızın amacı temel olarak, ÖSYM Fransızca Sınavlarından teşkil edilen bir derleme kelime sıklığı çözümlemesi yapılarak elde edilen bir kelime sıklığı listesi ortaya koymaktır. Bu kapsamda oluşturulan derlem ÖSYM tarafından 2000-2023 arasında gerçekleştirilen muhtelif sınavlarından elde edilmiştir. Çalışma derlemi birbirinden farklı 18.635 kelimeden ve toplamda 752.474 kelimeden oluşmaktadır. Derlem üzerinde Doğal Dil İşleme araçları (Python ve Spacy) kullanılarak yapılan sıklık çözümlemesi neticesinde, en sık kullanılan 1000 kelimenin derlemin %82,31'lik kısmını oluşturduğu, en sık kullanılan 2000 kelimenin derlemin %89,39'lık kısmını oluşturduğu, en sık kullanılan 3000 kelimenin derlemin %92,67'lık kısmını oluşturduğu, en sık kullanılan 4000 kelimenin derlemin %94,46'lık kısmını oluşturduğu görülmektedir. Ayrıca, çeşitli çalışmalarla okuduğunu anlama sınırı olarak belirlenmiş olan %95 sınırı için ise 4439 kelime gerektiği belirlenmiştir. Dolayısı ile çalışmamız neticesinde sıklıkla kullanılan nispeten küçük bir kelime topluluğunun çok defa tekrar ederek derlemin büyük kısmını oluşturduğu tespit edilmiştir. Böylece, hem bu sınava hazırlananların, hem de genel amaçlı Fransızca öğrenenlerin öncelikli olarak belirlenen bu kelimelere odaklanmalarının gelişimlerini hızlandırabileceği ve dil edinim sürecine katkı sağlayabileceği öngörülmektedir. Ek olarak elde edilen verilerin, konuya ilişkin çalışma yapan araştırmacılara ve sınav materyali hazırlayanlara da rehberlik edebileceği değerlendirilmektedir.
One of the most fundamental elements of foreign language education is vocabulary learning and teaching. However, since it is not possible to learn all the words in a language, the importance of the words to be learned should be considered when determining which words to prioritize. The most objective criterion in determining important words is their frequency of use, and this can be determined through word frequency analysis. Word frequency analysis is a linguistic method used to count how frequently each word appears in a particular text or corpus. By analyzing the frequency of words with this method, it is understood which words are frequently used and which are rarely used. Thus, it is possible to make inferences about both the target language and the corpus used. In our study, the corpus to be created for word frequency analysis is primarily based on the French exams conducted by ÖSYM. The rationale behind this selection is that these exams are taken as a criterion for measuring knowledge of French in our country. The primary aim of our study is to create a word frequency list by conducting a word frequency analysis on a corpus compiled from ÖSYM French exams. The corpus in our study has been compiled from various ÖSYM exams administered between 2000 and 2023. This corpus consists of 18,635 unique words and a total of 752,474 words. The frequency analysis conducted on the corpus using Natural Language Processing (NLP) tools (Python and Spacy) revealed that the 1,000 most frequently used words account for 82.31% of the corpus, the 2,000 most frequently used words account for 89.39%, the 3,000 most frequently used words account for 92.67%, and the 4,000 most frequently used words account for 94.46%. In addition, it was determined that 4,439 words were required for the 95% limit, which was determined as the reading comprehension threshold by various studies. Therefore, as a result of our study, it has been determined that a relatively small group of frequently used words constitutes a large part of the corpus by repeating many times. Thus, it is foreseen that focusing on these words as a priority for both those who are preparing for this exam and those who are learning French for general purposes can accelerate their development and contribute to the language acquisition process. In addition, it is evaluated that the data obtained can also guide researchers working on the subject and those who prepare exam materials.
One of the most fundamental elements of foreign language education is vocabulary learning and teaching. However, since it is not possible to learn all the words in a language, the importance of the words to be learned should be considered when determining which words to prioritize. The most objective criterion in determining important words is their frequency of use, and this can be determined through word frequency analysis. Word frequency analysis is a linguistic method used to count how frequently each word appears in a particular text or corpus. By analyzing the frequency of words with this method, it is understood which words are frequently used and which are rarely used. Thus, it is possible to make inferences about both the target language and the corpus used. In our study, the corpus to be created for word frequency analysis is primarily based on the French exams conducted by ÖSYM. The rationale behind this selection is that these exams are taken as a criterion for measuring knowledge of French in our country. The primary aim of our study is to create a word frequency list by conducting a word frequency analysis on a corpus compiled from ÖSYM French exams. The corpus in our study has been compiled from various ÖSYM exams administered between 2000 and 2023. This corpus consists of 18,635 unique words and a total of 752,474 words. The frequency analysis conducted on the corpus using Natural Language Processing (NLP) tools (Python and Spacy) revealed that the 1,000 most frequently used words account for 82.31% of the corpus, the 2,000 most frequently used words account for 89.39%, the 3,000 most frequently used words account for 92.67%, and the 4,000 most frequently used words account for 94.46%. In addition, it was determined that 4,439 words were required for the 95% limit, which was determined as the reading comprehension threshold by various studies. Therefore, as a result of our study, it has been determined that a relatively small group of frequently used words constitutes a large part of the corpus by repeating many times. Thus, it is foreseen that focusing on these words as a priority for both those who are preparing for this exam and those who are learning French for general purposes can accelerate their development and contribute to the language acquisition process. In addition, it is evaluated that the data obtained can also guide researchers working on the subject and those who prepare exam materials.
Description
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
360
