Jump to content
  • 0

Fog index en Lexical density


JeanWM

Question

Ik probeer beide waarden te berekenen maar zie door de letters de woorden niet meer.

 

We praten over een willekeurige opgegeven tekst in een tekstveld, die uit 1 of verschillende zinnen kan bestaan.

 

Fog Index = (het gemiddeld aantal woorden in een zin / het percentage van gebruikte woorden met 3 of meer klinkers) x 0.4

 

Lexical Density = (het aantal verschillende gebruikte woorden in een zin / het totaal aantal woorden) x 100.

 

Wie wil/kan hier even mee over brainstormen ?

 

AUB. we blijven even in FM 6 met het geheel.

Link to comment

7 answers to this question

Recommended Posts

  • 0

Knap lastig is een deel van de uitdaging...

 

Scripten, ja , waarschijnlijk voor een deel.

 

Loopen, daar raak ik je kwijt Koen. Ik blijf eigenlijk toch in 1 record.

 

Voorlopig heb ik volgende berekeningen:

 

1. Een totalWordCount

2. Een totalUniqueWords

3. Een countSentences

4. Een AVGWordsSentence

5. Een count LetterPerWord

6. Eenn countVowelPerWord

 

Om van daaruit (met nog wat meer) de Fog en de Density te berekenen.

(berekening heb ik nog niet)

Maar steeds van 1 invoerveld per record.

 

Het is te vergelijken met een student die een zin ingeeft in een veld, knoppeke drukt en de berekening wordt gemaakt.

Eigenlijk kunnen we volstaan met 1 record en het tekstveld moet nog eens niet een global zijn. Kan leeggemaakt worden voor er een nieuwe berekening gemaakt wordt, maar zover zijn we nog niet.

 

Om nu niet altijd alles opnieuw te moeten 'aanmaken' denk ik aan een systeem om alle nieuw gebruikte woorden in een afzonderlijk bestandje te stoppen, en daar de berekening van letters per woord en klinkers per woord te laten gebeuren.

Bij de ingave van een nieuwe zin zou dan een controle gedaan worden op het aanwezig zijn van ieder woord in de lijst. Aanwezig = geen recordaanmaak, Niet aanwezig = recordaanmaak.

 

Dat geeft dan ook nog het voordeel dat er bijna automatisch een 'woordenlijst' wordt aangemaakt, waarmee ik later nog vanalles kan aanvangen. Per slot van rekening vind je niet snel een woordenlijst waar de 'vervoeging' al heeft plaatsgevonden....(enkel een brainstormidee).

 

In hoeverre het geheel onderhevig zal zijn aan vertraging....daar heb ik even het raden naar....

Link to comment
  • 0

Bij 5. dien ik dus ook alle leestekens buiten beschouwing te laten, zoals komma, punt, spatie enz., vermits bij Lenght de spaties en de punctuations worden meegeteld.

 

Wat zou het snelst gaan, script of calculatie ?

 

Ieder woord in een veld, of een return delimited lijst en vandaaruit vertrekken ?

 

Ik drop nu al alle woorden in een return delimited veld....

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Answer this question...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...