Текстови бази от данни
 

Продължителност на курса

 40 часа

Анотация 

Курсът обхваща от тема Управление на информацията” („Information Management (IM)”) на ACM Computing Curricula 2001, Computer Science, подтемите:
- IM11. Съхраняване на информацията и извличането й (Information storage and retrieval [elective])
- IM12. Хипертекст и хипермедия (Hypertext and hypermedia [elective])
.

Необходими предварителни познания

Предполага се, че учащите имат основни знания по информатика.

Съдържание  

Подтема IM 11

1. Символи, символни низове, кодиране, текст

2. Документи, електронни публикации, маркировки и езици за маркировка

3. Дървета, инвертирани файлове, индексация, речникови файлове

4. Морфологичен анализ, корени, фрази, стоп-думи

5. Честота на разпределението на термите, неопределеност, размитост, тежести

6. Векторно пространство, вероятностни, логически и други модели

7. Нуждата от информация, съответствие, търсене, ефективност

8. Тезауруси, онтологии, класификация и категоризация, метаданни

9. Библиографска информация, библиометрика, цитати

10. Маршрутизация и филтриране

11. Търсене и стратегии на търсене, поведение при търсене на информация, модел на потребителя, обратна връзка

12. Обобщаване на информацията и визуализация

13. Интеграция на цитатите, ключовите думи, схемата на класификация и другите терми

14. Протоколи и системи


  Подтема IM12:

1. Хипертекстови модели

2. Видове връзки, машини и (разпределени) хипертекстови архитектури

3. Възли, съставни елементи и котви

4. Измерения, единици, места

5. Навигация, видове, разглеждане, детайли

6. Автоматична генерация на връзки

7. Представяне, трансформации, синхронизация

8. Авторство, четене и анотации

9. Протоколи и системи