Ищите список частот слова TXT для тестирования программы - PullRequest
1 голос
/ 14 мая 2009

Мне нужен файл из 200-1000 или около того наиболее часто используемых слов в английском языке. Мне удалось найти нелепые списки из 200 000 слов или что-то еще, но ничего с меньшим набором наиболее часто используемых слов.

Желательно, чтобы слова были по одному в строке, но если это не так, я могу их отформатировать.

СПАСИБО! * * 1005

Ответы [ 4 ]

1 голос
/ 14 мая 2009

Здесь - топ 500. Возможно, вы можете вычеркнуть список из HTML.

1 голос
/ 14 мая 2009

Я искал в Google «английские слова по частоте» и нашел много хороших источников. Вот один на wiktionary.org .

0 голосов
/ 14 мая 2009

Вот лучшие 250 (вы подчеркнули, что чем меньше, тем больше) по ссылке McWafflestix, прямо вверх, без посторонних пробелов и т. Д. Благодаря kill-rectangle в emacs. Я должен сказать, что это довольно тривиально и не связано с программированием.

the
of
to
and
a
in
is
it
you
that
he
was
for
on
are
with
as
I
his
they
be
at
one
have
this
from
or
had
by
hot
but
some
what
there
we
can
out
other
were
all
your
when
up
use
word
how
said
an
each
she
which
do
their
time
if
will
way
about
many
then
them
would
write
like
so
these
her
long
make
thing
see
him
two
has
look
more
day
could
go
come
did
my
sound
no
most
number
who
over
know
water
than
call
first
people
may
down
side
been
now
find
any
new
work
part
take
get
place
made
live
where
after
back
little
only
round
man
year
came
show
every
good
me
give
our
under
name
very
through
just
form
much
great
think
say
help
low
line
before
turn
cause
same
mean
differ
move
right
boy
old
too
does
tell
sentence
set
three
want
air
well
also
play
small
end
put
home
read
hand
port
large
spell
add
even
land
here
must
big
high
such
follow
act
why
ask
men
change
went
light
kind
off
need
house
picture
try
us
again
animal
point
mother
world
near
build
self
earth
father
head
stand
own
page
should
country
found
answer
school
grow
study
still
learn
plant
cover
food
sun
four
thought
let
keep
eye
never
last
door
between
city
tree
cross
since
hard
start
might
story
saw
far
sea
draw
left
late
run
don't
while
press
close
night
real
life
few
stop
0 голосов
/ 14 мая 2009

Можно написать простое решение, которое не проверено, но должно быть на 99% хорошо.

<?php
$fh = fopen('http://domain.tld/path/tofile.txt', 'r');
$wordList = array();
for($i=0;$i<100;$i++)
    $wordList[] = fread($fh, 1024);
print_r($wordList);
?>
...