Информатика 8-9: Измерение количества информации

1.44

«Вы выходите на следующей остановке?» — спросили человека в автобусе. «Нет», — ответил он. Сколько информации содержит ответ?

1.45

Какой объем информации содержит сообщение, уменьшающее неопределенность знаний в 4 раза?

1.46

Вы подошли к светофору, когда горел желтый свет. После этого загорелся зеленый. Какое количество информации вы при этом получили?

1.47

Вы подошли к светофору, когда горел красный свет. После этого загорелся желтый свет. Сколько информации вы при этом получили?

1.48

Группа школьников пришла в бассейн, в котором 4 дорожки для плавания. Тренер сообщил, что группа будет плавать на дорожке номер 3. Сколько информации получили школьники из этого сообщения?

1.49

В корзине лежат 8 шаров. Все шары разного цвета. Сколько информации несет сообщение о том, что из корзины достали красный шар?

1.50

Была получена телеграмма: «Встречайте, вагон 7». Известно, что в составе поезда 16 вагонов. Какое количество информации было получено?

1.51

В школьной библиотеке 16 стеллажей с книгами. На каждом стеллаже 8 полок. Библиотекарь сообщил Пете, что нужная ему книга находится на пятом стеллаже на третьей сверху полке. Какое количество информации библиотекарь передал Пете?

1.52

При угадывании целого числа в диапазоне от 1 до N было получено 7 бит информации. Чему равно N?

1.53

При угадывании целого числа в некотором диапазоне было получено 6 бит информации. Сколько чисел содержит этот диапазон?

1.54

Сообщение о том, что ваш друг живет на 10 этаже, несет 4 бита информации. Сколько этажей в доме?

1.55

Сообщение о том, что Петя живет во втором подъезде, несет 3 бита информации. Сколько подъездов в доме?

1.56

В коробке лежат 7 разноцветных карандашей. Какое количество информации содержит сообщение, что из коробки достали красный карандаш?

1. 57

Какое количество информации несет сообщение: «Встреча назначена на сентябрь».

1.58

Какое количество информации несет сообщение о том, что встреча назначена на 15 число?

1.59

Какое количество информации несет сообщение о том, что встреча назначена на 23 октября в 15.00?

1.60

Какое количество информации несет в себе сообщение о том, что нужная вам программа находится на одной из восьми дискет?

1.61

Какое количество информации получит второй игрок при игре в крестики-нолики на поле 8×8, после первого хода первого игрока, играющего крестиками?

1.62

В рулетке общее количество лунок равно 128. Какое количество информации мы получаем в зрительном сообщения об остановке шарика в одной из лунок?

1.63

Происходит выбор одной карты из колоды в 32 карты. Какое количество информации мы получаем в зрительном сообщении о выборе определенной карты?

Тема : Измерение информации

8 кл Домашнее задание №2

Тема: Измерение информации

1. Алфавит племени Мульти состоит из 32 букв. Какое количество информации несёт одна буква этого алфавита?

2. Сообщение, записанное буквами из 16-символьного алфавита, содержит 50 символов. Какой объём информации оно несёт?

3. Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если его объём составил 1/16 часть Мегабайта?

4. Сколько килобайтов составит сообщение из 384 символов 16-ти символьного алфавита?

5. Два сообщения содержат одинаковое количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите

не превышает 10 и на каждый символ приходится целое число битов?

8 кл Домашнее задание №2

Тема: Измерение информации

1.  Алфавит племени Мульти состоит из 32 букв. Какое количество информации несёт одна буква этого алфавита?

2. Сообщение, записанное буквами из 16-символьного алфавита, содержит 50 символов. Какой объём информации оно несёт?

3. Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если его объём составил 1/16 часть Мегабайта?

4. Сколько килобайтов составит сообщение из 384 символов 16-ти символьного алфавита?

5. Два сообщения содержат одинаковое

количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10 и на каждый символ приходится целое число битов?

Домашние задания-8 кл

Домашние работы 8 класс

ДЗ №1 Единицы измерения информации

  1. 1. Определите, какое из сообщений является для вас информативным (объясните – почему?).
    1. площадь Тихого океана – 179 млн. кв. км.
    2. Москва – столица России.
    3. Вчера весь день шел дождь.
    4. Завтра ожидается солнечная погода.
    5. Дивергенция однородного векторного поля равна нулю.
    6. Dog – собака (по-английски).
    7. Ro do, may si, lot do may.
    8. 2*2 = 4
  2. Сравните (поставьте знак отношения):
    1. 200 байт и 0,25 Кбайта,
    2. 3 байта и 24 бита,
    3. 1536 бит и 1,5 Кбайт,
    4. 1000 бит и 1 Кбайт,
    5. 8192 байта и 1 Кбайт.
  3. Перевести
    80 бит= байт
    800 бит= Кбайт
    40960 бит= Кбайт
    1/16 Мбайт= бит
    875 байт= бит

ДЗ №2 Определение количества информации

  1. Приветствие участникам олимпиады от марсиан записано с помощью всех символов марсианского алфавита: ТЕВИРП!КИ!. Сколько информации оно несет?Определите тип следующих величин:
  2. Один символ марсианского алфавита несет 4 бита информации. Какова мощность алфавита?
  3. Приветствие участникам олимпиады от лунных человечков записано с помощью всех символов лунного алфавита: ЮМА_ЮМ. Сколько информации оно несет?
  4. Сообщение, записанное буквами из 64-х символьного алфавита, содержит 20 символов. Какой объем информации оно несет?
  5. Племя Мульти имеет 32-х символьный алфавит. Племя Пульти использует 64-х символьный алфавит. Вожди племен обменялись письмами. Письмо племени Мульти содержало 80 символов, а письмо племени Пульти — 70 символов. Сравните объемы информации, содержащейся в письмах.
  6. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинских строк:
    Певец Давид был ростом мал, Но повалил же Голиафа!
  7. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Жан-Жака Руссо:
    Тысячи путей ведут к заблуждению, к истине – только один.
  8. Сколько существует различных последовательностей из символов «плюс» и «минус», длиной ровно в 5 символов?
  9. Обычный дорожный светофор без дополнительных секций подает шесть видов сигналов (непрерывные красный, желтый и зеленый, мигающий желтый, мигающий зеленый, мигающие красный и желтый одновременно). Электронное устройство управления светофором последовательно воспроизводит записанные сигналы. Подряд записано 100 сигналов светофора. Сколько байтов составляет данное информационное сообщение.
  10. В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимального возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того, как промежуточный финиш прошли 70 велосипедистов?
  11. В лотерее разыгрывается 64 шара. Выигрышная комбинация состоит из Х шаров, и сообщение о ней несет 42 бита информации. Чему равно Х?
  12. Сколько информации несет сообщение о том, что было угадано число в диапазоне целых чисел от 684 до 811?
  13. Книга состоит из 64 страниц. На каждой странице 256 символов. Какой объем информации содержится в книге, если используемый алфавит состоит из 32 символов?
  14. В кодировке Unicode каждый символ кодируется 16 битами. Каков информационный объем следующего сообщения?
    2+2=4, а 5+5=10.
  15. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 16 символов. Второй текст в алфавите мощностью 256 символов. Во сколько раз количество информации во втором тексте больше, чем в первом?
  16. Информационное сообщение объемом 1,5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?
  17. Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мбайта. Каков размер алфавита, с помощью которого записано сообщение?
  18. Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если объем его составил 1/16 часть Мбайта?
  19. Сколько килобайтов составляет сообщение, содержащее 12288 битов?
  20. Сколько килобайтов составит сообщение из 384 символов 16-ти символьного алфавита?
  21. Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста?
  22. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?
  23. Для записи сообщения использовался 64-х символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байтов информации и занимает 6 страниц. Сколько символов в строке?
  24. Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой станице записано 256 символов. Какова мощность использованного алфавита?
  25. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode:
    Привычка свыше нам дана: замена счастью она.
  26. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 16 символов, а второй текст – в алфавите из 256 символов. Во сколько раз количество информации во втором тексте больше, чем в первом?
  27. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 8-битном коде, в 16-битную кодировку Unicode. При этом информационное сообщение увеличилось на 2048 байт. Каков был информационный объем сообщения до перекодировки?
  28. Объем сообщения – 7,5 кбайт. Известно, что данное сообщение содержит 7680 символов. Какова мощность алфавита?
  29. Шахматная доска состоит 8 столбцов и 8 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?
  30. Дан текст из 600 символов. Известно, что символы берутся из таблицы размером 16 на 32. Определите информационный объем текста в битах.
  31. Мощность алфавита равна 256. Сколько кбайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?
  32. Объем сообщения равен 11 кбайт. Сообщение содержит 11264 символа. Какова мощность алфавита?
  33. Для кодирования секретного сообщения используются 12 специальных значков-символов. При этом символы кодируются одним и тем же минимально возможным количеством бит. Чему равен информационный объем сообщения длиной в 256 символов?
  34. Мощность алфавита равна 64. Сколько кбайт памяти потребуется, чтобы сохранить 128 страниц текста, содержащего в среднем 256 символов на каждой странице?
  35. Для кодирования нотной записи используется 7 значков-нот. Каждая нота кодируется одним и тем же минимально возможным количеством бит. Чему равен информационный объем сообщения, состоящего из 180 нот?
  36. Сообщение на языке племени Мульти содержит 64 символа, что составляет 1/32 часть Кбайта. Сколько символов содержит алфавит племени Мульти?
  37. Книга состоит из 20 страниц. На каждой странице – 320 символов. Какой объем информации в Килобитах содержится в книге, если используемый алфавит состоит из 64 символов?
  38. Информационное сообщение объемом 0,25 Кбайт содержит 1024 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?
  39. Для записи текста использовался 32 – символьный алфавит. Каждая страница содержит 40 строк по 50 символов в строке. Какой объем информации в Килобайтах содержат 7 страниц текста?
  40. Сообщение занимает 5 страниц по 25 строк. В каждой строке записано по 60 символов. Сколько символов в алфавите, если все сообщение содержит 3750 байтов?
  41. Какое максимальное количество страниц книги (32 строки по 64 символа, 1 символ занимает 8 бит) поместится в файле объемом 64 Кбайт.
  42. Информационная емкость человеческой яйцеклетки приблизительно равна 233 бит. Какое количество винчестеров (по 20 Мб) потребуется чтобы уместить генетическую информацию одного человека.
  43. Вариант текста в среднем имеет объем 20 Кбайт (на каждой странице текста 40 строк по 64 символа в каждой , 1 символ занимает 8 бит). Найти количество страниц в тексте.
  44. Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.
  45. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?
  46. В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 70 велосипедистов?
  47. Репетиционный экзамен в школе сдают 125 человек. Каждому из них выделяют специальный номер, идентифицирующий его в автоматической системе проверки ответов. При регистрации участника для записи его номера система использует минимально возможное количество бит, одинаковое для каждого участника. Каков объем информации в битах, записанный устройством после регистрации 60 участников?
  48. В скачках участвуют 20 лошадей. Специальное устройство регистрирует прохождение каждой лошадью финиша, записывая её номер с использованием минимально возможного количества бит, одинаковое для каждой лошади. Каков информационный объем сообщения, записанного устройством, если до финиша добрались только 15 из 20 участвовавших в скачках лошадей?
  49. Два сообщения содержат одинаковое количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10 и на каждый символ приходится целое число битов?
  50. Два сообщения содержат одинаковое количество информации. Количество символов в первом тексте в 2,5 раза меньше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что размер каждого алфавита не превышает 32 символов и на каждый символ приходится целое число битов?
  51. ДНК человека (генетический код) можно представить себе как некоторое слово в четырехбуквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид. Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5 х1023 нуклеотидов?
  52. Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере, равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту?
  53. Система оптического распознавания символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 65536 символов. Какое количество информации будет нести текстовый документ после 5 минут работы приложения, страницы которого содержат 40 строк по 50 символов?

ДЗ №3 Устройства ввода-вывода

  1. Используя учебник заполнить таблицу
    Устройства вводаУстройства вывода
    НаименованиеОсновные характеристикиНаименованиеОсновные характеристики

ДЗ №4 Файлы и файловая система

  1. Запишите полный путь к файлу readme.txt, если известно, что он хранится в папке HELP, вложенной в папку HOME, находящейся на диске D:.
  2. Дана иерархическая файловая структура:

    Записать полные пути ко всем файлам данной структуры.
  3. Выберите из предложенного списка файлов только те, которые относятся к графическим (используются для хранения рисунков): my.doc, family.jpg, car.bmp, bell.mp3, dog.gif, song.wav, book.zip, war.avi.
  4. Запишите полную информацию обо всех приведённых ниже файлах (имя, расширение, размер, дата и время создания или модификации): *

Пр.р.2.3 Определение разрешающей способности мыши в Windows

  1. выполнить пункты 1-3 учебника (стр. 135-136) для 3 опытов и заполнить таблицу. Все вычисления выполнить за таблицей.
    № опытаРасстояние на экране по горизонтали (в точках)Расстояние на столе (см)Расстояние на столе (в дюймах)Разрешающая способность мыши (точек/дюйм)
    1.     
    2.    
    3.    
  2. Вычислить среднее значение. Находим среднее арифметическое для разрешающей способности мыши (3-ий столбец)
  3. Делаем вывод

ДЗ №6 Передача информации в компьютерных сетях

Решить задачи.
  1. Скорость передачи данных через ADSL-соединение равна 1024000 бит/c. Передача файла через данное соединение заняла 5 секунд. Определите размер файла в килобайтах.
  2. Скорость передачи данных через ADSL-соединение равна 256000 бит/c. Передача файла через это соединение заняла 2 минуты. Определите размер файла в килобайтах.
  3. Скорость передачи данных через модемное соединение равна 51 200 бит/с. Передача текстового файла через это соединение заняла 10 с. Определите, сколько символов содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode.
  4. Скорость передачи данных через ADSL-соединение равна 128000 бит/с. Передача текстового файла через это соединение заняла 1 минуту. Определите, сколько символов содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode.
  5. Информационное сообщение объемом 2.5 кбайт передается со скоростью 2560 бит/мин. За сколько минут будет передано данное сообщение?
  6. Модем передает данные со скоростью 7680 бит/с. Передача текстового файла заняла 1,5 мин. Определите, сколько страниц содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode, а на одной странице – 400 символов.
  7. Средняя скорость передачи данных с помощью модема равна 36 864 бит/с. Сколько секунд понадобится модему, чтобы передать 4 страницы текста в 8-битной кодировке КОИ8, если считать, что на каждой странице в среднем 2 304 символа?
  8. Скорость передачи данных через модемное соединение равна 4096 бит/с. Передача текстового файла через это соединение заняла 10 с. Определите, сколько символов содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode.
  9. Передачи данных через ADSL-соединение заняла 2 минуты. За это время был передан файл, размер которого 3 750 Кбайт. Определите минимальную скорость (бит/c), при которой такая передача возможна.
  10. Сколько секунд потребуется модему, передающему сообщения со скоростью 14 400 бит/с, чтобы передать сообщение длиной 225 кбайт?
  11. Сколько секунд потребуется модему, передающему сообщения со скоростью 28 800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется 1 байтом?
  12. Предположим, что длительность непрерывного подключения к сети Интернет с помощью модема для некоторых АТС не превышает 10 минут. Определите максимальный размер файла в кбайтах, который может быть передан за время такого подключения, если модем передает информация в среднем со скоростью 32 килобита/с.

Лекция 7. Вычисление количества информации по формулам Хартли и Шеннона. Решение задач

Лекция 7. Вычисление количества информации по формулам Хартли и Шеннона. Решение задач

 

При определении количества информации на основе уменьшения неопределенности наших знаний мы рассматриваем информацию с точки зрения содержания, ее понятности и новизны для человека. С этой точки зрения в опыте по бросанию монеты одинаковое количество информации содержится и в зрительном образе упавшей монеты, и в коротком сообщении «Орел», и в длинной фразе «Монета упала на поверхность земли той стороной вверх, на которой изображен орел».

Однако при хранении и передаче информации с помощью технических устройств целесообразно отвлечься от содержания информации и рассматривать ее как последовательность знаков (букв, цифр, кодов цветов точек изображения и так далее).

Набор символов знаковой системы (алфавит) можно рассматривать как различные возможные состояния (события). Тогда, если считать, что появление символов в сообщении равновероятно, по формуле (2.1) можно рассчитать, какое количество информации несет каждый символ.

Так, в русском алфавите, если не использовать букву ё, количество событий (букв) будет равно 32. Тогда:

32 = 2I, откуда I = 5 битов.

Каждый символ несет 5 битов информации (его информационная емкость равна 5 битов). Количество информации в сообщении можно подсчитать, умножив количество информации, которое несет один символ, на количество символов.

Количество информации, которое содержит сообщение, закодированное с помощью знаковой системы, равно количеству информации, которое несет один знак, умноженному на количество знаков.

Вопросы для размышления

1. Пусть две книги на русском и китайском языках содержат одинаковое количество знаков. В какой книге содержится большее количество информации с точки зрения алфавитного подхода?

 

Содержательный подход к измерению информации рассматривает информацию с точки зрения человека, как уменьшение неопределенности наших знаний.

Однако любое техническое устройство не воспринимает содержание информации.Поэтому в вычислительной технике используется другой подход к определению количества информации. Он называется алфавитным подходом.

При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы. 
Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык. 
Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.

Алфавит — множество символов, используемых при записи текста.

Мощность (размер) алфавита — полное количество символов в алфавите.

Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54. 
Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. В действительности это не совсем так, но для упрощения примем такое предположение. В каждой очередной позиции текста может появиться любой из N символов. Тогда, согласно известной нам формуле N = 2I (см. содержательный подход) каждый такой символ несет I бит информации, которое можно определить из решения уравнения: 2I = 54. Получаем: I = 5.755 бит — такое количество информации несет один символ в русском тексте.

Чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на I.
Посчитаем количество информации на одной странице книги. Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50×60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит.

При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита.

Таким образом, алфавитный подход к измерению информации можно изобразить в виде таблицы:

 

При использовании двоичной системы (алфавит состоит из двух знаков: 0 и 1) каждый двоичный знак несет 1 бит информации.

Применение алфавитного подхода удобно, прежде всего, при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые — старые», «понятные — непонятные» сведения.

Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода.

Удобнее всего измерять информацию, когда размер алфавита N равен целой степени двойки. Например, если N=16, то каждый символ несет 4 бита информации потому, что 24= 16. А если N =32, то один символ «весит» 5 бит.

Ограничения на максимальный размер алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы встречались при рассмотрении темы «Кодирование текствовой информации». Это алфавит мощностью 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания…. 
Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт. 
1 байт = 8 бит.

Для измерения больших объемов информации используются следующие единицы: 

1 Кб (один килобайт)= 1024 байт=210байт
1 Мб (один мегабайт)= 1024 Кб=210Кбайт=220байт
1 Гб (один гигабайт)= 1024 Мб=210Mбайт=230байт
1Тбайт (один терабайт)=210Гбайт=1024Гбайт=240байт
1Пбайт(один петабайт)=210Тбайт=1024Тбайт=250байт
1Эбайт(один экзабайт)=210Пбайт=1024Пбайт=260байт
1Збайт(один зетабайт)=210Эбайт=1024Эбайт=270байт
1Йбайт(один йотабайт)=210Збайт=1024Збайт=280байт. 

Алфавитный подход к определению количества информации РЕШЕНИЕ ЗАДАЧ

При хранении и передаче информации с помощью технических устройств информацию следует рассматривать как последовательность символов — знаков (букв, цифр, кодов цветов точек изображения и т.д.).

Набор символов знаковой системы (алфавит) можно рассматривать как различные возможные состояния (события). 
Тогда, если считать, что появление символов в сообщении равновероятно, количество возможных событийN можно вычислить как N=2i 
Количество информации в сообщении I можно подсчитать умножив количество символов K на информационный вес одного символа i 
Итак, мы имеем формулы, необходимые для определения количества информации в алфавитном подходе:

 

N=2i

i

Информационный вес символа, бит

 

N

Мощность алфавита

I=K*i

K

Количество символов в тексте

 

I

Информационный объем текста

Возможны следующие сочетания известных (Дано) и искомых (Найти) величин:

 

Тип

Дано

Найти

Формула

1

i

N

N=2i

2

N

i

 

3

i,K

I

I=K*i

4

i,I

K

 

5

I, K

i

 

6

N, K

I

Обе формулы

7

N, I

K

 

8

I, K

N

 

 

Если к этим задачам добавить задачи на соотношение величин, записанных в разных единицах измерения, с использованием представления величин в виде степеней двойки мы получим 9 типов задач.  
Рассмотрим задачи на все типы. Договоримся, что при переходе от одних единиц измерения информации к другим будем строить цепочку значений. Тогда уменьшается вероятность вычислительной ошибки.

Задача 1. Получено сообщение, информационный объем которого равен 32 битам. чему равен этот объем в байтах? 

Решение: В одном байте 8 бит. 32:8=4 
Ответ: 4 байта.

Задача 2. Объем информацинного сообщения 12582912 битов выразить в килобайтах и мегабайтах. 

Решение: Поскольку 1Кбайт=1024 байт=1024*8 бит, то 12582912:(1024*8)=1536 Кбайт и 
поскольку 1Мбайт=1024 Кбайт, то 1536:1024=1,5 Мбайт 
Ответ:1536Кбайт и 1,5Мбайт.

Задача 3. Компьютер имеет оперативную память 512 Мб. Количество соответствующих этой величине бит больше:

1) 10 000 000 000бит 2) 8 000 000 000бит 3) 6 000 000 000бит 4) 4 000 000 000бит Решение: 512*1024*1024*8 бит=4294967296 бит. 
Ответ: 4.

Задача 4. Определить количество битов в двух мегабайтах, используя для чисел только степени 2. 
Решение: Поскольку 1байт=8битам=23битам, а 1Мбайт=210Кбайт=220байт=223бит. Отсюда, 2Мбайт=224бит. 
Ответ: 224бит.

Задача 5. Сколько мегабайт информации содержит сообщение объемом 223бит? 
Решение: Поскольку 1байт=8битам=23битам, то 
223бит=223*223*23бит=210210байт=210Кбайт=1Мбайт. 
Ответ: 1Мбайт

Задача 6. Один символ алфавита «весит» 4 бита. Сколько символов в этом алфавите? 
Решение: 
Дано:

i=4

По формуле N=2i находим N=24N=16

Найти: — ?

 


Ответ: 16

Задача 7.  Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите? 
Решение: 
Дано:

i=8

По формуле N=2i находим N=28N=256

Найти:— ?

 


Ответ: 256

Задача 8. Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита? 
Решение: 
Дано:

N=32

По формуле N=2i находим 32=2i, 25=2i,i=5

Найти: i— ?

 


Ответ: 5

Задача 9. Алфавит состоит из 100 символов. Какое количество информации несет один символ этого алфавита? 
Решение: 
Дано:

N=100

По формуле N=2i находим 32=2i, 25=2i,i=5

Найти: i— ?

 


Ответ: 5

Задача 10. У племени «чичевоков» в алфавите 24 буквы и 8 цифр. Знаков препинания и арифметических знаков нет. Какое минимальное количество двоичных разрядов им необходимо для кодирования всех символов? Учтите, что слова надо отделять друг от друга! 
Решение: 
Дано:

N=24+8=32

По формуле N=2i находим 32=2i, 25=2i,i=5

Найти: i— ?

 


Ответ: 5

Задача 11.  Книга, набранная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Ответ дайте в килобайтах и мегабайтах 
Решение: 
Дано:

K=360000

Определим количество символов в книге 150*40*60=360000. Один символ занимает один байт. По формуле I=K*iнаходим I=360000байт 360000:1024=351Кбайт=0,4Мбайт

Найти: I— ?

 


Ответ: 351Кбайт или 0,4Мбайт

Задача 12. Информационный объем текста книги, набранной на компьютере с использованием кодировки Unicode, — 128 килобайт. Определить количество символов в тексте книги. 
Решение: 
Дано:

I=128Кбайт,i=2байт

В кодировке Unicode один символ занимает 2 байта. Из формулыI=K*iвыразимK=I/i,K=128*1024:2=65536

Найти: K— ?

 


Ответ: 65536

Задача 13.Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Определить информационный вес одного символа использованного алфавита 
Решение: 
Дано:

I=1,5Кбайт,K=3072

Из формулы I=K*iвыразимi=I/K,i=1,5*1024*8:3072=4

Найти: i— ?

 


Ответ: 4

Задача 14.Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет? 
Решение: 
Дано:

N=64, K=20

По формуле N=2i находим 64=2i, 26=2i,i=6. По формуле I=K*i I=20*6=120

Найти: I— ?

 


Ответ: 120бит

Задача 15. Сколько символов содержит сообщение, записанное с помощью 16-символьного алфавита, если его объем составил 1/16 часть мегабайта? 
Решение: 
Дано:

N=16, I=1/16 Мбайт

По формуле N=2i находим 16=2i, 24=2i,i=4. Из формулы I=K*i выразим K=I/iK=(1/16)*1024*1024*8/4=131072

Найти: K— ?

 


Ответ: 131072

Задача 16. Объем сообщения, содержащего 2048 символов,составил 1/512 часть мегабайта. Каков размер алфавита, с помощью которого записано сообщение? 
Решение: 
Дано:

K=2048,I=1/512 Мбайт

Из формулы I=K*i выразим i=I/Ki=(1/512)*1024*1024*8/2048=8. По формулеN=2iнаходим N=28=256

Найти: N— ?

 


Ответ: 256

Задачи для самостоятельного решения:

  1. Каждый символ алфавита записывается с помощью 4 цифр двоичного кода. Сколько символов в этом алфавите?

  2. Алфавит для записи сообщений состоит из 32 символов, каков информационный вес одного символа? Не забудьте указать единицу измерения.

  3. Информационный объем текста, набранного на компьюте¬ре с использованием кодировки Unicode (каждый символ кодируется 16 битами), — 4 Кб. Определить количество символов в тексте.

  4. Объем информационного сообщения составляет 8192 бита. Выразить его в килобайтах.

  5. Сколько бит информации содержит сообщение объемом 4 Мб? Ответ дать в степенях 2.

  6. Сообщение, записанное буквами из 256-символьного ал¬фавита, содержит 256 символов. Какой объем информации оно несет в килобайтах?

  7. Сколько существует различных звуковых сигналов, состоящих из последовательностей коротких и длинных звонков. Длина каждого сигнала — 6 звонков.

  8. Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 20 до 100%, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатом наблюдений.

  9. Скорость передачи данных через ADSL-соединение равна 512000 бит/с. Через данное соединение передают файл размером 1500 Кб. Определите время передачи файла в секундах.

  10. Определите скорость работы модема, если за 256 с он может передать растровое изображение размером 640х480 пикселей. На каждый пиксель приходится 3 байта. А если в палитре 16 миллионов цветов?

Тема определения количества информации на основе алфавитного подхода используется в заданиях А1, А2, А3, А13, В5 контрольно-измерительных материалов ЕГЭ.

ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА ИНФОРМАЦИИ

представленной с помощью знаковых систем

Вариант 1

01 Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита?

02 Сообщение, записанное буквами из 64-х символьного алфавита, содержит 20 символов. Какой объем информации оно несет?

03 Племя Мульти имеет 32-х символьный алфавит. Племя Пульти использует 64-х символьный алфавит. Вожди племен обменялись письмами. Письмо племени Мульти содержало 80 символов, а письмо племени Пульти — 70 символов. Сравните объемы информации, содержащейся в письмах.

04 Информационное сообщение объемом 1,5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?

05 Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мбайта. Каков размер алфавита, с помощью которого записано сообщение?

Вариант 2

01 Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если объем его составил 1/16 часть Мбайта?

02 Сколько килобайтов составляет сообщение, содержащее 12288 битов?

03 Сколько килобайтов составит сообщение из 384 символов 16-ти символьного алфавита?

04 Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста?

05 Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?

 

Вариант 3

01 Для записи сообщения использовался 64-х символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байтов информации и занимает 6 страниц. Сколько символов в строке?

02 Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой станице записано 256 символов. Какова мощность использованного алфавита?

03 Для записи текста использовался код Unicode. Каждая страница содержит 30 строк по 50 символов в строке. Какое количество информации содержат 6 страниц текста? Выразить в Кбайтах

 04 Сравните (поставьте знак отношения)

1) 3 байта _____24 бита.

2) 1536 бит_____ 1,5 Кбайта..

05 Скорость передачи данных через ADSL-соединение равна 256 000 бит/с. Передача файла через данное соединение заняла 3 мин. Определите размер файла в килобайтах.

Вариант 4

01 Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита?

02 Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1/512 часть одного мегабайта?

03 Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере, равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту?

04 Система оптического распознавания символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 65536 символов. Какое количество информации будет нести текстовый документ после 5 минут работы приложения, страницы которого содержат 40 строк по 50 символов?

05 На странице 32 строки, в каждой строке 64 символа. Определите информационный объём рассказа, если каждый символ кодируется 16 битами.

Вариант 5

 

01 Сколько килобайт занимает текстовая информация, записанная на 10 страницах. На каждой странице 256 символов, один символ занимает 8 бит.

02 Переведите единицы количества информации

a) 87 байт в биты

b) 122880 бит в кбайты

c) 18432 кбайт в Мбайты

03 Какое количество информации несет двоичный код 101111011?

04 Студенты сдают экзамен по информатике по билетам. Преподаватель сообщил им, что информационное сообщение о номере билета содержит 7 битов информации. Сколько экзаменационных билетов?

05 Переведите:

a) 94 байта в биты

b) 25 кбайт в биты

Вариант 6

 

01 Из непрозрачного мешочка вынимают шарики с номерами, известно, что информационное сообщение о номере шарика несет 7 бит информации. Определить количество шариков в мешочке

02 Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы:

Привычка свыше нам дана: Замена счастию она.

Выразить в байтах.

03 Считая, что каждый символ кодируется одним байтом. Каждая страница содержит 30 строк по 70 символов в строке. Какое количество информации содержат 3 страницы текста? Выразить в килобайтах

04 Информационный объем текста книги, набранной на компьютере с использованием кодировки Unicode, — 128 килобайт. Определить количество символов в тексте книги.

05 Файл объемом 5120 Кбайт передается по локальной сети. Скорость передачи данных равна 256 000 бит/с. Сколько времени в минутах займет передача данных?

Вариант 7

 

01 На странице 48 строк, в каждой строке 64 символа. Определите информационный объём рассказа, если каждый символ кодируется 8 битами. Выразить в килобайтах.

02 Сколько килобайт занимает текстовая информация, записанная на 20 страницах. На каждой странице 128 символов, один символ занимает 8 бит.

03 Переведите единицы количества информации 
а) 712 бит в байты

б) 16 кбайт в биты

в) 32 Гбайта в Мбайты

04 Какое количество информации несет двоичный код 101101011?.

05 Из непрозрачного мешочка вынимают шарики с номерами и известно, что информационное сообщение о номере шарика несет 6 битов информации. Определите количество шариков в мешочке. (Подробное решение)

 

Вариант 8

01 Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Определить информационный вес одного символа использованного алфавита 

02 Переведите: а) 448 бит в байты б) 147456 бит в кбайты

03 В корзине лежат шары. Все разного цвета. Сообщение о том, что достали синий шар, несет 5 бит информации. Сколько всего шаров было в корзине?

04 Книга, набранная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Ответ дайте в мегабайтах 

05 Считая, что каждый символ кодируется двумя байтами, оцените информационный объем следующего предложения:

Один пуд – около 16,4 килограмм.

Дополнительные задания:

01 Два сообщения содержат одинаковое количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10 и на каждый символ приходится целое число битов?

02 Два сообщения содержат одинаковое количество информации. Количество символов в первом тексте в 2,5 раза меньше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что размер каждого алфавита не превышает 32 символов и на каждый символ приходится целое число битов?

03 ДНК человека (генетический код) можно представить себе как некоторое слово в четырехбуквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид. Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5 х1023 нуклеотидов?

Персональный сайт преподавателя информатики — Задача 1.7

Задачи для самостоятельного решения

1. Эллочка-людоедка (в лексиконе которой, как известно, было 30 слов) произносит фразу, состоящую из 50 слов. Какое количество информации в битах сообщает Эллочка? Примечание. В данной задаче за мощность алфавита следует принять словарный запас Эллочки. Так как при нахождении информационного веса одного слова не получается целое число, то здесь целесообразно учитывать условие: для расчета количества информации необходимо взять наименьшее целое число i такое что, 2​i>= N.

Ответ: Количество информации, которое сообщила Эллочка равно 250 бит.


2. Дополнительный экзамен при поступлении в ВВУЗ сдают 100 абитуриентов. Каждому из них выделают специальный номер, идентифицирующий его в автоматической системе проверки ответов. При регистрации участника для записи его номера система использует минимальное возможное количество бит, одинаковое для каждого участника. Каков объем информации в битах, записанный устройством после регистрации 60 участников?

Ответ: 420 бит.


3. Для передачи секретного сообщения используется код, состоящий из десятичных цифр. При этом все цифры кодируются одним и тем же (минимально возможным) количеством бит. Определите информационный объем в битах сообщения длиной в 150 символов.

Ответ: 600 бит.


4. В алфавите некоторого языка всего две буквы А и Б. Все слова этого языка состоят из 11 букв. Каков максимальный словарный запас этого языка?

​Ответ: 2048 слов.


5. Два сообщения содержат одинаковое количество информации. Количество символов в первом тексте в 2,5 раза меньше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что размер каждого алфавита не превышает 32 символов и на каждый символ приходится целое число битов?

​Ответ: 4 и 32 символа


6. Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации в байтах содержит 5 страниц текста?

Ответ: 10500байт


7. В языке некоторого племени всего 16 букв. Все слова состоят из 5 букв, всего в языке 8000 слов. Сколько памяти в байтах потребуется для хранения всех слов этого языка?

Ответ:  20000байт


8. В некоторой кодировке слово из 20 букв занимает на 42 байта больше, чем слово из шести букв. Сколько бит отводится на одну букву, если под все символы этой кодировки отводится равный объем памяти?

Ответ: 24 бита


9. Текст, записанный с помощью 16-ти символьного алфавита, занимает 10 полных секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит этот текст?

Ответ: 10240символов


10. Система оптического распознавания символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 256 символов. Какое количество информации в байтах будет нести текстовый документ после 5 минут работы приложения, страницы которого содержат 40 строк по 50 символов?

Ответ: 40000байт

Определение количества информации

представленной с помощью знаковых систем

Вариант 1

01

Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита?

02

Сообщение, записанное буквами из 64-х символьного алфавита, содержит 20 символов. Какой объем информации оно несет?

03

Племя Мульти имеет 32-х символьный алфавит. Племя Пульти использует 64-х символьный алфавит. Вожди племен обменялись письмами. Письмо племени Мульти содержало 80 символов, а письмо племени Пульти — 70 символов. Сравните объемы информации, содержащейся в письмах.

04

Информационное сообщение объемом 1,5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?

05

Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мбайта. Каков размер алфавита, с помощью которого записано сообщение?

Вариант 2

01

Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если объем его составил 1/16 часть Мбайта?

02

Сколько килобайтов составляет сообщение, содержащее 12288 битов?

03

Сколько килобайтов составит сообщение из 384 символов 16-ти символьного алфавита?

04

Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста?

05

Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?

 

Вариант 3

01

Для записи сообщения использовался 64-х символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байтов информации и занимает 6 страниц. Сколько символов в строке?

02

Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой станице записано 256 символов. Какова мощность использованного алфавита?

03

Для записи текста использовался код Unicode. Каждая страница содержит 30 строк по 50 символов в строке. Какое количество информации содержат 6 страниц текста? Выразить в Кбайтах

 

04

Сравните (поставьте знак отношения)

1) 3 байта _____24 бита.

2) 1536 бит_____ 1,5 Кбайта..

05

Скорость передачи данных через ADSL-соединение равна 256 000 бит/с. Передача файла через данное соединение заняла 3 мин. Определите размер файла в килобайтах.

Вариант 4

01

Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита?

02

Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1/512 часть одного мегабайта?

03

Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере, равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту?

04

Система оптического распознавания символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 65536 символов. Какое количество информации будет нести текстовый документ после 5 минут работы приложения, страницы которого содержат 40 строк по 50 символов?

05

На странице 32 строки, в каждой строке 64 символа. Определите информационный объём рассказа, если каждый символ кодируется 16 битами.

Вариант 5

 

01

Сколько килобайт занимает текстовая информация, записанная на 10 страницах. На каждой странице 256 символов, один символ занимает 8 бит.

02

Переведите единицы количества информации

a) 87 байт в биты

b) 122880 бит в кбайты

c) 18432 кбайт в Мбайты

03

Какое количество информации несет двоичный код 101111011?

04

Студенты сдают экзамен по информатике по билетам. Преподаватель сообщил им, что информационное сообщение о номере билета содержит 7 битов информации. Сколько экзаменационных билетов?

05

Переведите:

a) 94 байта в биты

b) 25 кбайт в биты

Вариант 6

 

01

Из непрозрачного мешочка вынимают шарики с номерами, известно, что информационное сообщение о номере шарика несет 7 бит информации. Определить количество шариков в мешочке

02

Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы:

Привычка свыше нам дана: Замена счастию она.

Выразить в байтах.

03

Считая, что каждый символ кодируется одним байтом. Каждая страница содержит 30 строк по 70 символов в строке. Какое количество информации содержат 3 страницы текста? Выразить в килобайтах

04

Информационный объем текста книги, набранной на компьютере с использованием кодировки Unicode, — 128 килобайт. Определить количество символов в тексте книги.

05

Файл объемом 5120 Кбайт передается по локальной сети. Скорость передачи данных равна 256 000 бит/с. Сколько времени в минутах займет передача данных?

Вариант 7

 

01

На странице 48 строк, в каждой строке 64 символа. Определите информационный объём рассказа, если каждый символ кодируется 8 битами. Выразить в килобайтах.

02

Сколько килобайт занимает текстовая информация, записанная на 20 страницах. На каждой странице 128 символов, один символ занимает 8 бит.

03

Переведите единицы количества информации
а) 712 бит в байты

б) 16 кбайт в биты

в) 32 Гбайта в Мбайты

04

Какое количество информации несет двоичный код 101101011?.

05

Из непрозрачного мешочка вынимают шарики с номерами и известно, что информационное сообщение о номере шарика несет 6 битов информации. Определите количество шариков в мешочке. (Подробное решение)

 

Вариант 8

01

Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Определить информационный вес одного символа использованного алфавита

02

Переведите: а) 448 бит в байты б) 147456 бит в кбайты

03

В корзине лежат шары. Все разного цвета. Сообщение о том, что достали синий шар, несет 5 бит информации. Сколько всего шаров было в корзине?

04

Книга, набранная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Ответ дайте в мегабайтах

05

Считая, что каждый символ кодируется двумя байтами, оцените информационный объем следующего предложения:

Один пуд – около 16,4 килограмм.

Дополнительные задания:

01

Два сообщения содержат одинаковое количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10 и на каждый символ приходится целое число битов?

02

Два сообщения содержат одинаковое количество информации. Количество символов в первом тексте в 2,5 раза меньше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что размер каждого алфавита не превышает 32 символов и на каждый символ приходится целое число битов?

03

ДНК человека (генетический код) можно представить себе как некоторое слово в четырехбуквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид. Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5 х1023 нуклеотидов?

 

Задачи на количество информации

Задачи на количество информации для 7 класса 1. Сколько бит информации содержится в сообщении: «четверть  килобайта»? 18бит 2. Сколько бит информации содержится в сообщении: «пять мегабайт»?  13 3. Племя Мульти имеет 32­символьный алфавит. Племя Пульти  пользуется 64­символьный алфавитом. Вожди племен обменялись  письмами.  Письмо племени Мульти содержало 80 символов, а письмо  племени Пульти – 70 символов. 4. Сколько бит информации содержится в сообщении размером 8 байтов? 64   5. Сравните объем информации, содержащейся в письмах. a. Объем письма племени Пульти меньше на 10 байт b. Объем письма племени Пульти больше на 20 байт c. Объем письма племени Мульти меньше на 20 бит d. Объем письма племени Мульти больше на 10 бит e. Объем письма племен Мкльти больше на 20 бит 6. Сообщение на языке племени Мульти содержит 128 символов,  занимающих 1/16 часть килобайта. Сколько символов содержит алфавит племени Мульти? 16 7. Два сообщения содержат одинаковое количество символов. Количество  информации в первом тексте в 1,5 раза больше, чем во втором. Сколько  символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10  и на каждый символ приходится целое число битов? 8. Сообщение, записанное буквами из 64­символьного алфавита, содержит  20 символов. Какой объем информации оно несет?120 9. Приветствие участникам олимпиады от лунных человечков записано с  помощью всех символов лунного алфавита: ЮМА_ЮМ. Сколько  информации оно несет? 18 10.Информационное сообщение объемом 1,5 Кбайта содержит 3072  символа. Сколько символов содержит алфавит, при помощи которого  было записано это сообщение? 16 11.Алфавит племени Мульти состоит из 32 букв. Какое количество  информации несёт одна буква этого алфавита?5 12.Сообщение, записанное буквами из 16­символьного алфавита, содержит  50 символов. Какой объём информации оно несёт?200 13. Сколько символов содержит сообщение, записанное с помощью 16­ти  символьного алфавита, если его объём составил 1/16 часть Мегабайта? 131072 14.Сколько килобайтов составит сообщение из 384 символов 16­ти  символьного алфавита?0,1875 15.Если вариант теста в среднем имеет объем 20 килобайт (на каждой  странице теста 40 строк по 64 символа в строке, 1 символ занимает 8  бит), то количество страниц в тесте равно?8 стр 16. Считая, что один символ кодируется одним байтом, подсчитать в  байтах количество информации, содержащееся в фразе: “Терпение и  труд все перетрут.”29 17.Получено сообщение, информационный объём которого равен 32 битам. Чему равен этот объём в байтах?4 18.Считая, что каждый символ кодируется одним байтом, оцените  информационный объём предложения: «Мой дядя самых  честных  правил, Когда не в шутку занемог, Он уважать себя заставил И лучше  выдумать не мог.»106 19.Какое количество информации будет содержаться на странице  печатного текста при использовании 32­х символьного алфавита (на  странице 60 строк по 56 символов).16800бит 20.Определить количество информации, которое содержится на печатном  листе бумаги (двусторонняя печать), если на одной стороне умещается  40 строк по 67 символов в строке. 21.Сколько бит содержится в слове ИНФОРМАЦИЯ? 80 22.В каком алфавите одна буква несет в себе больше информации, в  русском или латинском? Примечание: в русском языке 33 буквы, в  латинском – 26 букв. 23.Сообщение , записанное буквами из 128­символьного алфавита,  содержит 30 символов. Какой объем информации оно несет?210 24.Мощность некоторого алфавита равна 64 символам. Каким будет объем информации в тексте, состоящем из 100символов.600 25.Информационный объем сообщения равен 4096 бит. Оно содержит 1024 символа. Какова мощность алфавита, с помощью которого составлено  это сообщение?16 26.Какое количество информации несет сообщение: «Встреча назначена на  май»? . 27.В школьной библиотеке 16 стеллажей с книгами. На каждом стеллаже 8  полок. Библиотекарь сообщил Пете, что нужная ему книга находится на пятом стеллаже на третьей сверху полке. Какое количество  информации библиотекарь передал Пете? 28.Объем сообщения, содержащего 4096 символов, равен 1/512 части  Мбайта. Какова мощность алфавита, с помощью которого записано это  сообщение?  29.Определите информационный объем текста «Бамбарбия! Кергуду!» 120 Перевод единиц измерения информации 1) Сколько бит в 2 байтах? 2) Переведите 12 Кбайт в байты. 3) Переведите 0,7 Мбайт в гигабайты. 4) Сколько Мбайт в 2 Гбайт? 5) 1 Кбайт = ___ байт = ______бит, 6) 2 Кбайт = _____ байт =______бит, 7) 24576 бит =_____байт =_____Кбайт, 8) 512 Кбайт = ___ байт =_____бит.  9) 1024 бита =____байт  10) 11) 12) 13) 14) 15)  2048000 бит = _____Кб 15 Кб = ____бит 10 байт = ____бит  Переведите 2 Мб в Кб, байты, биты.  Переведите 27262976 бит в Мб, Кб, байты __Гбайт =1536 Мбайт = __ Кбайт

Что, черт возьми, такое сегмент?

Вы создали идеальное текстовое сообщение. Пунш романа, упакованный в одно смс, достойный самого барда. Ваша кампания проходит без сучка и задоринки. Затем, когда вы посмотрите на свои расходы, вы увидите, что они в четыре раза больше, чем вы ожидали. Заставить вас задуматься: что за сегменты, черт возьми, и почему с меня берут плату за так много из них?

Мы откроем для себя стандарты SMS, чтобы дать вам ответ. Вот где мы рассмотрим:

Оглядываясь назад на Nokia Brick Phone, чтобы понять сегменты сообщений

Вспомните, когда вы впервые начали писать текстовые сообщения на своем старом добром нерушимом кирпичике Nokia.Выделяя сообщения на клавиатуре T9, вы, возможно, заметили, что счетчик тикает со 160 рядом с 1. Когда этот счетчик достигнет 0, вы увидите, что 1, который находится рядом с 160, подскочит до 2.
Это означает, что в вашем счете будет два сообщения. Это первое число подсчитывало, сколько символов у вас осталось на сегмент, а второе подсчитывало, сколько сегментов вы использовали.

Что изменилось в сегментах с тех пор Стандарты

SMS практически не изменились со времен кирпичного телефона.Сообщения по-прежнему отправляются блоками по 140 байтов, известными как сегменты сообщения.

Когда Twilio связывается с операторами связи для отправки SMS-сообщений, мы отправляем им по одному сегменту за раз. Чтобы выяснить, сколько символов это дает вам, нам нужно немного посчитать.

Немного математики, более четкое понимание сегментов

Стандартное кодирование SMS использует набор символов GSM 03. 38, который требует 7 бит для кодирования символа. 140 байт x 8 битов в байте, разделенном на 7 бит, оставляет нам 160-символьный сегмент сообщения.

Сегменты сообщений — это то, как Twilio (и индустрия SMS в целом) считает сообщения.

Это означает, что, помимо затрат, при анализе пропускной способности SMS следует также думать о сегментах. Пропускная способность зависит от используемого числа отправки, но во всех случаях она рассчитывается с точки зрения количества сегментов сообщения в секунду, а не общего количества сообщений.

Если для вас важно выводить сообщение в определенном окне, убедитесь, что вы знаете, сколько сегментов вы отправляете.

Как ведет себя идеальное сообщение?

Возвращаясь к своему идеальному текстовому сообщению, вы пересчитываете символы, а что-то все еще кажется неправильным. Вы использовали всего 210 символов, но похоже, что каждое из этих сообщений состоит более чем из двух сегментов.

Частично ответ заключается в кодировке. Обратите внимание, что в этом сообщении в качестве кодировки указан UCS2 вместо GSM. Чтобы разместить такое же яркое сообщение, как это, Twilio должен использовать другой набор символов. Если вы щелкнули по ссылке GSM выше, вы могли заметить, что она не содержала никаких «?».Когда вы отправляете сообщения с символами, отличными от GSM, такими как Emojis, мы должны использовать другой тип кодирования, известный как UCS-2. UCS2 требует 16 бит для кодирования каждого символа, поэтому, возвращаясь к математике, которую мы сделали выше, теперь у нас есть ограничение в 70 символов (140 байт * 8 бит в байте / 16 бит). Помимо эмодзи, вам также следует быть осторожным с акцентированными символами. GSM 03.38 включает некоторые символы с диакритическими знаками, такие как ñ, à и ö, но не включает другие, такие как á, í или ú.

Что именно делает заголовок данных?

Тем не менее, похоже, что с этим ограничением в 70 символов это сообщение должно состоять только из трех сегментов, а не из четырех. Последний кусок головоломки — это конкатенация. Когда вы отправляете многосегментные сообщения, Twilio использует заголовки пользовательских данных, чтобы сообщить адресату, как его собрать. Это занимает 6 байтов на сообщение, оставляя только 67 символов для сообщений в кодировке UCS2 или 153 символа для сообщений в кодировке GSM.

Может оказаться, что огненные смайлики того не стоят. Однако, когда вы сокращаете то же сообщение и повторно отправляете его, оно все равно работает не совсем правильно:

Это сообщение содержит две из ошибок , которые обычно вызывают проблемы с кодированием: умные кавычки и не-GSM пробелы.Взгляните на это сообщение, которое выглядит почти идентичным:

Были заменены только три символа: пробелы между предложениями были изменены с «на» (U + 2002 на U + 0020) и «умная цитата» после того, как Шекспир был заменен стандартным апострофом «вместо» ( От U + 2019 до U + 0027). Умные цитаты обычно возникают из-за того, что текстовые редакторы чертовски полезны. Пространства, не относящиеся к GSM, обычно являются результатом копирования и вставки. Будьте особенно осторожны с ними, поскольку они часто превращаются в обычные пространства для демонстрации.Консоль twilio.com является одним из таких мест, а это означает, что тела сообщений, содержащие в API пробелы, отличные от GSM, будут отформатированы как обычные пробелы U + 0020 для отображения.

Всегда важно знать набор символов, прежде чем отправлять сообщения. Вы также можете использовать это приложение для предварительной проверки определенных сообщений: https://twiliodeved.github.io/message-segment-calculator/.

После прочтения этого сообщения в блоге вы полностью готовы к принятию решения о том, стоят ли эмодзи того, исключите умные кавычки и пробелы, не относящиеся к GSM, перед отправкой сообщений и точно подсчитайте сегменты перед запуском кампании, а не после.

Почему обрезаются SMS-сообщения … и что с этим делать

Возможно, в последнее время вы заметили, что некоторые из ваших SMS-сообщений обрезаются (обрезаются) все чаще. Читайте дальше, чтобы узнать, почему это происходит, какие проблемы это может вызвать, и, самое главное, что вы можете сделать, чтобы это предотвратить!

Об усечении

Вы, наверное, слышали, что SMS-сообщения могут содержать не более 160 символов (буквы, цифры, пробелы, знаки препинания и т. Д.). Обычно это так, но бывают случаи, когда этот предел снижается до 140 или даже 70 символов.

Если ваше сообщение ограничено 70 символами, но вы отправляете сообщение из 150 символов, ваш телефон фактически разделит его на три сообщения: первое 70 символов, второе 70 символов и последнее из оставшихся 10 символов. . Вот тут-то и возникают проблемы, особенно потому, что эти три сообщения могут даже быть доставлены не по порядку.

Так почему же обычно сообщение из 160 символов ограничивается 70 символами? Чтобы не вдаваться в технические подробности, воспользуемся аналогией.Представьте, что SMS-сообщение похоже на чемодан, который летит в самолете, и его вес ограничен 140 фунтами (технически байтами данных). Обычно каждый символ весит 0,875 фунта (7/8 фунта, или 7 бит данных), поэтому вы можете поместить 160 из них в свой чемодан.

Но, допустим, вы хотите взять с собой каких-нибудь необычных персонажей, каждый из которых весит 2 фунта. Теперь только 70 из этих специальных символов весит полные 140 фунтов! А у авиакомпании есть правило: если вы вообще возьмете с собой двухфунтовых персонажей, то ваша сумка получит специальный ярлык, и вы должны относиться ко всем своим персонажам как по 2 фунта каждый, даже если они обычные! Таким образом, наличие даже одного специального персонажа ограничивает вас всего до 70.

Особые «тяжелые» персонажи

А что такое особенный персонаж? Обычные буквы, цифры и пробелы, которые вы обычно вводите, не особенные. Даже в большинстве знаков препинания нет ничего особенного. Но «умные» или «фигурные» варианты общепринятой пунктуации бывают. Например, простой старый апостроф или одинарная кавычка не особенные, а причудливая фигурная. И старый добрый дефис не является чем-то особенным, а вот длинное тире — особенным!

  «Я простой - и обычный».  

vs.

  «Я умный и особенный!»  

Посмотрите два приведенных выше предложения для сравнения и увеличьте масштаб или внимательно посмотрите. В первом мы используем стандартные простые старые знаки препинания. Но во втором случае это все умные фигурные кавычки, и более длинное тире — это круто! Персонажи красивее, но тяжелее.

Возникшие проблемы

Как мы уже упоминали, когда длина отправляемого вами сообщения превышает установленный лимит, ваш телефон сам разбивает его на несколько сообщений. Каждое из этих сообщений является независимым и может поступать в любом порядке.Ваш оператор мобильной связи и человек или система, получающие сообщения, просто видят несколько несвязанных сообщений.

Если сообщения получает человек, он, вероятно, поймет, что вы намеревались сделать. Но если вы отправляете в компьютерную систему, она, скорее всего, запутается, обрежет первую часть вашего сообщения, отбросит вторую и, возможно, ответит запутанным сообщением об ошибке.

Одна из распространенных ситуаций, когда компьютер пытается понять ваше сообщение, — это использование функции «Co-Manager» в TextMarks для запуска группового оповещения с помощью текстового сообщения с вашего телефона.Когда вы отправляете текст на номер 41411 типа « ALERT MYKEYWORD Это мое сообщение здесь ... », если вы включаете какие-либо специальные символы, то все это обрезается до 70 символов, оставляя обычно менее 60 для самого вашего сообщения , и в результате оставшаяся часть будет неверно истолкована как отдельный запрос.

Советы по предотвращению усечения

Теперь, когда мы избавились от всего этого, почему в последнее время это происходит чаще и как избежать этого?

Основная причина, по которой это происходит сейчас чаще, заключается в том, что в iOS 11 (операционная система iPhone, выпущенная в сентябре 2017 года) есть новая функция, которая по умолчанию преобразует обычные знаки препинания в их более причудливые аналоги. Если вы обновились до последней версии iOS, тогда ваш телефон вызывает у вас эти проблемы. К счастью, эту «функцию» легко отключить:

Перейдите в «Настройки » > «Общие» > Клавиатура , затем найдите параметр «Умная пунктуация» и переведите переключатель в положение «Выкл.». Теперь ваш телефон будет вести себя так же, как и раньше, то есть он не будет запихивать эти причудливые двухфунтовые символы в ваш чемодан без вашего разрешения.

Некоторые телефоны Android также могут начать реализовывать эту «функцию», и если вы заметите, что это происходит, сообщите нам в комментариях ниже, какой у вас телефон / ОС и как ее отключить.

Еще один способ избежать этой проблемы с функцией Co-Manager — использовать другие средства отправки предупреждений на ходу. Если вы войдете в свою панель управления TextMarks и перейдете на экран отправки предупреждений, вы увидите специальную ссылку на нашу страницу «Отправить мобильное уведомление», включая инструкции по добавлению ее в закладки в виде значка на главном экране для быстрого доступа. Более подробно это описано в Руководстве по TextMarks: Добавление страницы отправки оповещений на свой телефон.

Поговорите со своим менеджером по работе с клиентами, чтобы узнать о других вариантах делегирования управления группой вашей команде.

Заключение

Надеюсь, после прочтения этой статьи вы лучше понимаете, что происходит с усечением сообщений, как новые функции iOS могут вызывать проблемы, которые вы видите, и, что наиболее важно, как избежать этих проблем в будущем. Дайте нам знать в комментариях ниже или через наш центр поддержки, если это поможет или у вас есть другие советы или вопросы по теме!

Excel СЧЕТЕСЛИ и СЧЕТЕСЛИ с несколькими критериями И / ИЛИ

В руководстве объясняется, как использовать формулы СЧЁТЕСЛИ и СЧЁТЕСЛИ с несколькими критериями в Excel на основе логики И и ИЛИ.Вы найдете ряд примеров для различных типов данных — чисел, дат, текста, подстановочных знаков, непустых ячеек и т. Д.

Из всех функций Excel, СЧЁТЕСЛИМН и СЧЁТЕСЛИ, вероятно, чаще всего смешивают, потому что они очень похожи и обе предназначены для подсчета ячеек на основе заданных критериев.

Разница в том, что СЧЁТЕСЛИ предназначена для подсчета ячеек с одним условием в одном диапазоне, тогда как СЧЁТЕСЛИМН может оценивать разные критерии в том же или в разных диапазонах.Цель этого руководства — продемонстрировать различные подходы и помочь вам выбрать наиболее эффективную формулу для каждой конкретной задачи.

  • Функция СЧЁТЕСЛИМН в Excel — синтаксис и использование
  • Как использовать СЧЁТЕСЛИ и СЧЁТЕСЛИ с несколькими критериями

Функция СЧЁТЕСЛИМН в Excel — синтаксис и использование

Функция СЧЁТЕСЛИМН в Excel подсчитывает ячейки в нескольких диапазонах на основе одного или нескольких условий. Функция доступна в Excel 2019, 2016, 2013, Excel 2010 и Excel 2007, поэтому вы можете использовать приведенные ниже примеры в любой версии Excel.

Синтаксис СЧЕТЕСЛИ

Синтаксис функции СЧЁТЕСЛИМН следующий:

COUNTIFS (диапазон_критериев1, критерий1, [диапазон_критериев2, критерий2]…)

  • диапазон_критериев1 (обязательный) — определяет первый диапазон, к которому должно применяться первое условие ( критерий1 ).
  • критерий1 (обязательно) — задает условие в виде числа , ссылки на ячейку , текстовой строки , выражения или другой функции Excel .Критерии определяют, какие клетки должны быть подсчитаны, и могут быть выражены как 10, «<= 32», A6, «сладости».
  • [диапазон_критерия2, критерий2]… (необязательно) — это дополнительные диапазоны и связанные с ними критерии. В формулах можно указать до 127 пар диапазона / критерия.

На самом деле вам не нужно запоминать синтаксис функции СЧЁТЕСЛИ наизусть. Microsoft Excel отобразит аргументы функции, как только вы начнете печатать; аргумент, который вы вводите в данный момент, выделен жирным шрифтом.

Excel СЧЁТЕСЛИМН — что нужно помнить!

  1. Вы можете использовать функцию СЧЁТЕСЛИМН в Excel для подсчета ячеек в одном диапазоне с одним условием, а также в нескольких диапазонах с несколькими условиями. В последнем случае учитываются только те ячейки, которые соответствуют всем указанным условиям .
  2. Каждый дополнительный диапазон должен иметь такое же количество строк и столбцов, что и первый диапазон ( диапазон_критерия1 аргумент ).
  3. Разрешены как непрерывные диапазоны , так и несмежные диапазоны .
  4. Если критерием является ссылка на пустую ячейку , функция СЧЁТЕСЛИМН обрабатывает ее как нулевое значение (0).
  5. В критериях можно использовать подстановочные знаки — звездочку (*) и вопросительный знак (?). См. Этот пример для получения полной информации.

Как использовать СЧЁТЕСЛИ и СЧЁТЕСЛИ с несколькими критериями в Excel

Ниже вы найдете несколько примеров формул, демонстрирующих, как использовать функции СЧЁТЕСЛИ и СЧЁТЕСЛИ в Excel для оценки нескольких условий.

Как подсчитать ячейки по нескольким критериям (логика И)

Это самый простой сценарий, поскольку функция СЧЁТЕСЛИМН в Excel предназначена для подсчета только тех ячеек, для которых все указанные условия ИСТИНА. Мы называем это логикой И, потому что так работает функция И в Excel.

Формула 1. Формула СЧЁТЕСЛИМН с несколькими критериями

Предположим, у вас есть список продуктов, как показано на скриншоте ниже. Вы хотите получить количество товаров, которые есть в наличии (значение в столбце B больше 0), но еще не проданы (значение в столбце C равно 0).

Задачу можно решить по формуле:

= СЧЁТЕСЛИМН (B2: B7, «> 0», C2: C7, «= 0»)

И счет 2 (« вишни » и « лимонов »):

Формула 2.
Формула СЧЁТЕСЛИМН с теми же критериями

Если вы хотите подсчитать элементы с одинаковыми критериями, вам все равно необходимо указать каждую пару диапазон_критерия / отдельно.

Например, вот правильная формула для подсчета элементов, у которых 0 как в столбце B, так и в столбце C:

= СЧЁТЕСЛИМН ($ B $ 2: $ B $ 7, "= 0", $ C $ 2: $ C $ 7, "= 0")

Эта формула СЧЁТЕСЛИМН возвращает 1, потому что только « Виноград » имеет значение «0» в обоих столбцах.

Использование более простой формулы с одним диапазоном критериев , например СЧЁТЕСЛИМН (B2: C7, «= 0»), даст другой результат — общее количество ячеек в диапазоне B2: C7, содержащих ноль (в данном примере это 4 ).

Как подсчитать ячейки с несколькими критериями (логика ИЛИ)

Как вы видели в приведенных выше примерах, подсчет ячеек, удовлетворяющих всем указанным критериям, прост, потому что функция СЧЁТЕСЛИМН предназначена для работы таким образом.

Но что, если вы хотите подсчитать ячейки, для которых не менее одно из указанных условий ИСТИНА , т.е.е. на основе логики ИЛИ? В целом, есть два способа сделать это — сложив несколько формул СЧЁТЕСЛИ или используя формулу СУММ СЧЁТЕСЛИ с константой массива.

Формула 1. Сложите две или более формулы СЧЁТЕСЛИ или СЧЁТЕСЛИ

Предположим, что в приведенной ниже таблице вы хотите подсчитать заказы со статусами « отменено, » и «, ожидающих рассмотрения, ». Для этого вы можете просто написать 2 обычные формулы Countif и сложить результаты:

= СЧЁТЕСЛИ ($ C $ 2: $ C $ 11, «Отменено») + СЧЁТЕСЛИ ($ C $ 2: $ C $ 11, «Ожидание»)

Если предполагается, что каждая функция оценивает более одного условия, используйте СЧЁТЕСЛИ вместо СЧЁТЕСЛИ.Например, чтобы получить количество заказов « отменено » и « ожидающих » для « яблок » используйте следующую формулу:

= COUNTIFS ($ A $ 2: $ A $ 11, «Яблоки», $ C $ 2: $ C $ 11, «Отменено») + COUNTIFS ($ A $ 2: $ A $ 11, «Яблоки», $ C $ 2: $ C $ 11, «Ожидает рассмотрения»)

Формула 2.
SUM COUNTIFS с константой массива

В ситуациях, когда вам нужно оценить множество критериев, описанный выше подход — не лучший вариант, потому что ваша формула станет слишком большой.Чтобы выполнить те же вычисления в более компактной формуле, перечислите все критерии в константе массива и передайте этот массив аргументу критериев функции СЧЁТЕСЛИМН. Чтобы получить общее количество, вставьте СЧЁТЕСЛИМН в функцию СУММ, например:

СУММ (СЧЁТЕСЛИМН ( диапазон , {« критерий1 «, « критерий2 «, « критерий3 «,…}))

В нашей таблице-образце для подсчета заказов со статусом « Отменено, », « В ожидании, » или « В пути, » формула будет выглядеть следующим образом:

= СУММ (СЧЁТЕСЛИ ($ C $ 2: $ C $ 11, {"отменено", "ожидает", "в пути"}))

Аналогичным образом можно подсчитывать ячейки на основе двух или более пар критериев_диапазона / критериев .Например, чтобы получить количество заказов « яблок, », которые являются « отменено, », «, ожидающих рассмотрения, » или « в пути, », используйте эту формулу:

= СУММ (СЧЁТЕСЛИ (2 $: 11 австралийских долларов, «яблоки», 2 доллара США: 11 канадских долларов, {«отменено», «ожидается», «в пути»}))

В этом руководстве вы можете найти еще несколько способов подсчета ячеек с логикой ИЛИ: Excel СЧЁТЕСЛИ и СЧЁТЕСЛИ с условиями ИЛИ.

Как считать числа между двумя указанными числами

По большому счету, формулы СЧЁТЕСЛИМН для чисел делятся на 2 категории — на основе нескольких условий (объясненных в примерах выше) и между двумя указанными вами значениями.Последнее может быть выполнено двумя способами — с помощью функции СЧЁТЕСЛИ или путем вычитания одного СЧЁТЕСЛИ из другого.

Формула 1. СЧЁТЕСЛИ для подсчета ячеек между двумя числами

Чтобы узнать, сколько чисел от 5 до 10 (не включая 5 и 10) содержится в ячейках с C2 по C10, используйте эту формулу:

= СЧЁТЕСЛИМН (C2: C10, «> 5», C2: C10, «<10»)

Чтобы включить в счет 5 и 10, используйте операторы «больше или равно» и «меньше или равно»:

= СЧЁТЕСЛИМН (B2: B10, «> = 5», B2: B10, «<= 10»)

Формула 2.
Формулы СЧЁТЕСЛИ для подсчета чисел от X до Y

Тот же результат может быть получен путем вычитания одной формулы Countif из другой. Первый подсчитывает, сколько чисел больше, чем значение нижней границы (5 в этом примере). Вторая формула возвращает количество чисел, превышающих значение верхней границы (в данном случае 10). Разница между первым и вторым числом — это результат, который вы ищете.

  • = СЧЁТЕСЛИ (C2: C10, «> 5») — СЧЁТЕСЛИ (C2: C10, «> = 10») — подсчитывает, сколько чисел больше 5 и меньше 10 находятся в диапазоне C2: C10.Эта формула вернет то же количество, что и на скриншоте выше.
  • = СЧЁТЕСЛИ (C2: C10, «> = 5») — СЧЁТЕСЛИ (C2: C10, «> 10») — формула подсчитывает, сколько чисел от 5 до 10 находится в диапазоне C2: C10, , включая 5 и 10.

Как использовать ссылки на ячейки в формулах СЧЁТЕСЛИМН

При использовании логических операторов, таких как «>», «<», «<=» или «> =» вместе со ссылками на ячейки в формулах Excel СЧЁТЕСЛИМН, не забудьте заключить оператор в «двойные кавычки», а
добавить амперсанд ( &) перед ссылкой на ячейку для создания текстовой строки.

В приведенном ниже примере набора данных давайте посчитаем заказы « яблок » на сумму более 200 долларов. С диапазон_критерия1 в ячейках A2: A11 и диапазон_критерия2 в B2: B11, вы можете использовать эту формулу:

= СЧЁТЕСЛИ ($ A $ 2: $ A $ 11, «Яблоки», $ B $ 2: $ B $ 11, «> 200»)

Или вы можете ввести значения критериев в определенные ячейки, например F1 и F2, и указать эти ячейки в формуле:

= COUNTIFS ($ A $ 2: $ A $ 11, $ F $ 1, $ B $ 2: $ B $ 11, ">" & $ F $ 2)

Обратите внимание на использование абсолютных ссылок на ячейки в аргументах критериев и диапазон_критериев , что предотвращает нарушение формулы при копировании в другие ячейки.

Дополнительные сведения об использовании амперсанда в формулах СЧЁТЕСЛИ и СЧЁТЕСЛИМН, см. В Excel СЧЁТЕСЛИ — часто задаваемые вопросы.

Как использовать СЧЁТЕСЛИМН с подстановочными знаками

В формулах Excel СЧЁТЕСЛИМН можно использовать следующие подстановочные знаки:

  • Знак вопроса (?) — соответствует любому одиночному символу, используйте его для подсчета ячеек, начинающихся и / или заканчивающихся определенными символами.
  • Asterisk (*) — соответствует любой последовательности символов, вы используете ее для подсчета ячеек, содержащих указанное слово или символ (символы) как часть содержимого ячейки.

Наконечник. Если вы хотите подсчитать ячейки с фактическим вопросительным знаком или звездочкой, введите тильду (~) перед звездочкой или вопросительным знаком.

Теперь давайте посмотрим, как можно использовать подстановочный знак в реальных формулах СЧЁТЕСЛИМН в Excel. Предположим, у вас есть список проектов в столбце A. Вы хотите знать, сколько проектов уже назначено кому-либо, т.е. иметь любое имя в столбце B. И поскольку мы учимся использовать функцию СЧЁТЕСЛИМН с несколькими критериями, давайте добавим второе условие — также должна быть установлена ​​дата окончания в столбце D.

Вот формула, которая приносит удовольствие:

= СЧЁТЕСЛИМН (B2: B10, «*», D2: D10, «<>» & «»))

Обратите внимание, что вы не можете использовать подстановочный знак в критериях 2 и , потому что у вас есть даты, а не текстовые значения в столбце D. Вот почему вы используете критерий, который находит непустых ячеек: «<>» & «»

СЧЕТЕСЛИ и СЧЕТЕСЛИ с несколькими критериями для дат

Формулы СЧЁТЕСЛИ и СЧЁТЕСЛИ, которые вы используете для дат, очень похожи на приведенные выше формулы для чисел.

Пример 1. Подсчет дат в определенном диапазоне дат

Для подсчета дат, попадающих в определенный диапазон дат, вы также можете использовать формулу СЧЁТЕСЛИ с двумя критериями или комбинацию двух функций СЧЁТЕСЛИ.

Например, следующие формулы подсчитывают количество дат в ячейках с C2 по C10, которые попадают в период с 1 июня 2014 года по 7 июня 2014 года включительно:

= СЧЁТЕСЛИМН (C2: C9, «> = 1/6/2014», C2: C9, «<= 6/7/2014»)

= СЧЁТЕСЛИ (C2: C9, «> = 1/6/2014») - СЧЁТЕСЛИ (C2: C9, «> 07.06.2014»)

Пример 2.Подсчет дат с несколькими условиями

Таким же образом можно использовать формулу СЧЁТЕСЛИМН, чтобы подсчитать количество дат в разных столбцах, удовлетворяющих 2 или более условиям. Например, приведенная ниже формула покажет, сколько товаров было куплено после 20 -го мая и доставлено после 1 -го июня:

= СЧЁТЕСЛИМН (C2: C9, "> 01.05.2014", D2: D9, "> 07.06.2014")

Пример 3. Подсчет дат с несколькими условиями на основе текущей даты

Вы можете использовать функцию Excel СЕГОДНЯ () в сочетании с СЧЁТЕСЛИ для подсчета дат на основе текущей даты.

Например, следующая формула СЧЁТЕСЛИ с двумя диапазонами и двумя критериями сообщит вам, сколько продуктов уже было куплено, но еще не доставлено.

= СЧЁТЕСЛИМН (C2: C9, «<» & СЕГОДНЯ (), D2: D9, «>» & СЕГОДНЯ ())

Эта формула допускает множество возможных вариантов. Например, вы можете настроить его, чтобы подсчитать, сколько продуктов было куплено более недели назад и еще не доставлено:

= СЧЁТЕСЛИМН (C2: C9, "<=" & СЕГОДНЯ () - 7, D2: D9, ">" & СЕГОДНЯ ())

Вот как вы подсчитываете ячейки с несколькими критериями в Excel.Надеюсь, вы найдете эти примеры полезными. В любом случае, я благодарю вас за чтение и надеюсь увидеть вас в нашем блоге на следующей неделе!

Вас также может заинтересовать

FTB Публикация 923 | FTB.ca.gov

Раздел 1. Введение

Добро пожаловать

Благодарим вас за использование протокола безопасной передачи файлов (SWIFT) Департамента налогообложения франчайзинга (FTB) Swift - это быстрый и безопасный метод электронной пакетной передачи файлов и извлечения файлов из FTB.

SWIFT позволяет пользователям безопасно передавать информацию о резидентах, нерезидентах и ​​недвижимости (формы 592, 592-F и 593) в несколько программ FTB через Интернет с использованием HTTPS или FTPS. Наши Публикация FTB 1016 «Рекомендации по удержанию налогов в сфере недвижимости» и Публикация FTB 1017 «Рекомендации по удержанию налогов для резидентов и нерезидентов» содержат указания, когда требуется такая информация.

Преимущества использования SWIFT
  • Электронная подача - Отправьте информацию в электронном виде из форм удержания налогов для резидентов, нерезидентов и недвижимого имущества.(Формы 592, 592-F и 593).
  • Безбумажная обработка - Мы обеспечиваем нашим клиентам удобство обработки электронных форм.
  • Подтверждение получения - Мы предоставляем вам квитанцию ​​о получении.
  • Возможность исправления ошибок - Мы выполняем предварительную проверку файла и в тот же день уведомляем вас об ошибках, которые требуют исправления. Это дает вам возможность исправить и повторно отправить по мере необходимости.
  • Безопасная передача данных через Интернет - Мы используем новейшие технологии для обеспечения безопасности и конфиденциальности всех данных налогоплательщиков. Мы получаем файлы через 128-битное шифрование Secure Socket Layer.

Это руководство содержит следующее:

  • Техническая информация, необходимая для подготовки и передачи информации о вашей заполненной форме удержания в виде файлов данных через SWIFT, включая:
    • Процедуры ввода данных.
    • Описание кодов
    • ОШИБКА и ПРЕДУПРЕЖДЕНИЕ.
    • Инструкции по исправлению.

Это руководство дополняет и содержит ссылки на наше Руководство пользователя передатчика SWIFT с подробной информацией о регистрации и использовании SWIFT.

Раздел 2: Начало работы

  • Позвоните нам по телефону 916-845-3778, чтобы получить свой идентификатор пользователя SWIFT и пароль.
  • В защищенный почтовый ящик FTB (место, куда вы загружаете файлы для обработки).
  • Из защищенного почтового ящика FTB (место, куда мы помещаем файлы, которые вы можете получить).

Для получения дополнительной информации о регистрации в SWIFT и запросе идентификатора пользователя и пароля перейдите к разделу 14 «Свяжитесь с нами» на стр. 32.

Раздел 3. Как подготовить SWIFT-файл для удержания недвижимости

Создание и сохранение файла данных

Файл, который вы отправляете, должен содержать ту же информацию, которую вы вводите в бумажной форме 593 «Заявление о подоходном налоге на недвижимость», которую вы предоставляете каждому продавцу недвижимости.

Обратитесь к разделам с 5 по 8 за полезными советами и стандартными сокращениями, которые необходимо использовать для обеспечения приемлемости ваших данных.

Подача

SWIFT должна включать один файл, содержащий информацию о налоговом агенте и продавце из всех Форм 593, как мы объясняем в Публикации 1023R, Требования к электронной подаче налоговых деклараций в сфере недвижимости.

Формат файла - Мы принимаем файлы в формате с разделителями-запятыми (CSV). Назовите файл именем или фирменным наименованием налогового агента (например,g., johnsmithtitleco.csv).

Пользователи Microsoft Excel: Сохраните заполненный файл информации формы 593 в формате CSV.

Бумажные формы - Лица условного депонирования недвижимости (REEP), которые используют SWIFT для передачи информации об удержании прав на недвижимость, не должны подавать нам бумажную форму 593. Тем не менее, REEP должны уведомить продавцов недвижимости об удержанном налоге, предоставив им копии Формы 593 с указанием их удерживаемых сумм.

Срок платежа - Срок подачи файла SWIFT и платежа совпадает с датой платежа бумажной формы 593 и платежа, то есть до 20-го числа календарного месяца, следующего за месяцем закрытия условного депонирования.Для получения дополнительной информации см. Публикацию FTB 1016, Правила удержания налогов на недвижимое имущество.

Чтобы обеспечить своевременную обработку, отправляйте файл за несколько рабочих дней до 20-го числа месяца.

Измененные формы - Не используйте SWIFT для подачи измененной информации формы. См. Инструкции к форме 593 о том, как подавать измененные формы.

Отправьте платеж

После того, как вы передадите свой файл и мы его примем, отправьте общий удерживаемый платеж одним из следующих способов:

  • Электронный перевод денежных средств (EFT), который является нашим предпочтительным способом получения платежей.
  • Отправьте чек или денежный перевод по почте с заполненной формой 593-V «Платежный ваучер для удержания налога на недвижимость». Следуйте инструкциям по оплате и отправке ваучера.

Раздел 4. Как подготовить SWIFT-файл для удержания налогов для резидента и нерезидента

Создание и сохранение файла SWIFT

SWIFT-файл, который вы отправляете, должен содержать ту же информацию, что и в бумажной форме 592, Заявление об удержании налога для резидентов и нерезидентов, или в форме 592-F, Годовой отчет иностранного партнера или участника.

Обратитесь к разделам с 5 по 8 за полезными советами и стандартными сокращениями, используемыми для обеспечения приемлемости ваших данных.

Подача SWIFT

должна включать один файл, содержащий информацию о налоговом агенте и получателе платежа из Форм 592 или 592-F, как мы объясняем в Публикации 1023S, Требования к подаче электронных налогов для резидентов и нерезидентов.

Формат файла - Мы принимаем файлы в формате CSV. Назовите файл именем или фирменным наименованием налогового агента (например,g., johnsmithagent.csv). Пользователи Microsoft Excel: Сохраните заполненный файл данных формы 592 или формы 592-F в формате CSV.

Бумажные формы - Налоговые агенты, которые используют SWIFT для предоставления резидентской и нерезидентской информации об удержании налогов, не должны подавать нам бумажные формы 592 или 592-F. Однако налоговые агенты должны уведомлять получателей удерживаемого налога, предоставляя им копии Формы 592-B «Заявление о подоходном налоге для резидентов и нерезидентов» с указанием годового дохода в Калифорнии и удерживаемых сумм.

Срок оплаты - Срок подачи файла SWIFT и платежа такой же, как и срок платежа по бумажным формам 592 и 592-F и платежу. Для получения дополнительной информации см. Публикацию FTB 1017 «Правила удержания налогов для резидентов и нерезидентов».

Измененные формы - Не использовать SWIFT для подачи измененной информации формы. Инструкции по отправке измененных форм см. В Форме 592 и Форме 592-F.

Отправьте платеж

После того, как вы отправите свой файл и мы его примем, отправьте общий удерживаемый платеж одним из следующих способов:

  • Электронный перевод денежных средств (EFT), который является нашим предпочтительным способом получения платежей.
  • Отправьте чек или денежный перевод по почте с заполненным ваучером, Формой 592-V, Платежным Ваучером для удержания удержания резидентами и нерезидентами при подаче Формы 592; или заполненный ваучер, Форма 592-A, Платежный ваучер для иностранного партнера или Удержание членских взносов при подаче формы 592-F. Следуйте инструкциям по оплате и отправке ваучера.

Раздел 5: Инструкции по вводу данных

Используйте эти инструкции для ввода идентификационных номеров и адресной информации в формы 592, 592-F и 593. Эти правила дополняют Публикацию 1023R «Требования к подаче электронного налога на недвижимость» и Публикацию 1023S «Требования к подаче электронного налога для резидентов и нерезидентов».

Следуйте этим рекомендациям, чтобы предотвратить ошибки, которые могут привести к отклонению файла для исправления, как мы объясняем в Разделах 10 и 11.

Перейдите на ftb.ca.gov и найдите SWIFT , чтобы увидеть примеры создания файла Microsoft Excel.

Общие инструкции

  • Пропускайте знаки препинания или символы, если это специально не разрешено.
  • Используйте только эти символы в полях «Сущность» и «Адрес» формы:
    • Если адрес является частью адреса, введите косую черту (/).
    • Символы косая черта (/), дефис / тире (-), точка (.), Запятая (,) и число (#) - единственные специальные символы, разрешенные в полях «Адрес».

Идентификационный номер и идентификационный тип

  • Не вводите дефис в идентификационном номере .
  • Номер социального страхования (SSN)
    • Должен содержать девять цифровых символов.
    • Первая цифра не может быть 8.
  • Индивидуальный идентификационный номер налогоплательщика (ITIN)
    • Должен содержать девять цифровых символов.
    • Первая цифра должна быть 9.
  • Федеральный идентификационный номер работодателя (FEIN)
    • Должен содержать девять цифровых символов.
  • Номер калифорнийской корпорации (CaCorp)
    • Должен содержать семь цифровых символов.

Адресные поля

  • Используйте стандартные сокращения из Раздела 6 для суффикса названия улицы.
  • Примените стандартные сокращения, если адрес превышает длину поля. Если адрес все еще слишком длинный, обрежьте его.
  • Введите PMB , а затем номер ящика в поле «Адресная строка 2», если у налогоплательщика есть личный почтовый ящик. Если поле «Строка адреса 2» содержит другую информацию, введите PMB в конце поля «Строка адреса 1». Никогда не усекайте информацию PMB.
  • Введите дополнительную информацию, например, Имя или название компании , в поле «Адресная строка 2».Опустить обозначения c / o и ATTN .
  • Используйте стандартную двухбуквенную аббревиатуру для обозначения штата или владения США в поле «Штат», как показано в Разделе 7.

Иностранные адреса

  • Не вводите данные в полях «Штат» или «Почтовый индекс».
  • Используйте особые правила внешних адресов для следующего:
    • Гонконг - введите Гонконг в поле «Город» и Китай в поле «Страна».
    • Сингапур - введите Сингапур в поля «Город» и «Страна».
    • Нижняя Калифорния - введите Мексика в поле «Страна».
    • Канада - введите Канада в поле «Страна», а затем аббревиатуру провинции, как показано в Разделе 7.

Раздел 6: Стандартные сокращения

Используйте следующие стандартные сокращения для форм единственного или множественного числа этих слов:

Переулок (индекс ) (индекс руб.)
Имя Аббревиатура
База ВВС AFB
Америка (n) AMER
И / & /
Приложение ANX
Квартира
Апартаменты
APT
Ассоциированные компании
Ассоциация
АССОК
проспект
Avenida
AV
Банк BK
Батальон BTN
Аккумулятор BTRY
Пляж BCH
Бульвар BL
Ящик BX
Филиал BR
Бродвей BRDWY
Дом BLDG
Калифорния КАЛИФ
Каминита CMNTA
Каминито CMNTO
Camino CMNO
Каньон CYN
Дорога CSWY
Центр CTR
Центральный CTL
Круг CIR
Город CY
Побережье CST
Колледж CLG
Сообщество СВЯЗЬ
Содружество CMNWLTH
Компания CO
Выздоравливающий CONV
Корпорация CORP
Страна CNTRY
Уезд CNTY
Суд CT
Переход СИНГ
Отдел ОТДЕЛЕНИЕ
Подразделение / Подразделение DV
Привод DR
Восток E
Поместье EST
Скоростная EXPY
Плоский FLT
Этаж FL
Форт FT
Автострада FWY
Сад GDN
Шлюз GTWY
Роща ГРВ
Главный офис HQ
Высота HTS
Хайленд HGLD
шоссе HWY
Больница HOSP
Гостиница HTL
Зарегистрировано INC
Промышленность IND
Международный ИНТЛ
Остров / остров IS
Переход JCT
Озеро LK
) LN
Коттедж ЛДГ
Петля LP
Нижний LWR
Менеджмент MGMT
Усадьба MNR
Мартин Лютер Кинг (младший) М Л КОРОЛЬ
Авиабаза морской пехоты MCAS
Медицинский MED
Мемориал МЕМ
Миссия MSN
Мобильный МБЛ
Мотель MTL
Крепление MT
Гора MTN
Национальный NAT
Морской NAV
Авиабаза ВМФ NAB
Авиабаза ВМФ NAS
Север N
Северо-восток NE
Северо-запад NW
Номер / № НЕТ
Pacific PAC
Парк ПК
Parkway PKY
Место PL
Plaza PLZ
точка PT
Почтовое отделение PO
Presidio PRES
Частный почтовый ящик PMB
Ранчо Ранчо РНЧ
Река RIV
Дорога РД
Зал RM
Сельский тракт
Saint / Sainte СТ
Сан / Санто SN
Школа СЧ
Сервис СЕРВ
Юг S
Юго-восток SE
Юго-запад SW
Космос СП
Центр космических полетов SFC
Пружина САУ
Эскадрилья SQD
Квадрат SQ
Станция STA
улица (индекс СТ
Люкс STE
Налогоплательщик Неизвестен НЕИЗВЕСТНЫЙ НАЛОГОДАТЕЛЬ
Терминал СРОК
Терраса ТЕР
Колея ТРАК
Тропа TRL
Прицеп TRLR
Доверие TR
Единица / Союз ООН
Университет UNIV
Верхний UPR
Долина ВЛИ
Verdes VRD
Посмотреть VW
Вилла / Вилле VL
Деревня VLG
Виста VIS
Прогулка WK
Переход WKWY
Путь WY
Западный терминал Вт СРОК

Раздел 7: Стандартные сокращения штатов и диапазоны почтовых индексов

Используйте следующие стандартные сокращения и диапазоны для штатов и почтовых индексов:

Сокращения штатов
Государство Аббревиатура Почтовый индекс
Алабама AL 350-369
Аляска АК 995-999
Аризона AZ 850-865
Арканзас AR 716-729
Калифорния CA 900-962
Колорадо CO 800-816
Коннектикут CT 060-069
Делавэр DE 197-199
Округ Колумбия DC 200-205, 20799
Флорида FL 320-349
Грузия GA 300-319, 398-399
Гавайи HI 967-968
Айдахо ID 832-838
Иллинойс Иллинойс 600-629
Индиана IN 460-479
Айова IA 500-528
Канзас KS 660-679
Кентукки KY 400-427
Луизиана LA 700-714
Мэн ME 039-049
Мэриленд MD 20331, 20335-219
Массачусетс MA 010-027, 055н
Мичиган MI 480-499
Миннесота MN 550-567
Миссисипи MS 386-397, 71233
Миссури MO 630-658
Монтана MT 590-599
Небраска NE 680-693
Невада NV 889-898
Нью-Гэмпшир NH 030-038
Нью-Джерси NJ 070-089
Нью-Мексико НМ 870-884
Нью-Йорк NY 004, 005, 06390, 100–149
Северная Каролина NC 270-289
Северная Дакота ND 580-588
Огайо OH 430-459
Оклахома ОК 730-731, 734-749
Орегон ИЛИ 970-979
Пенсильвания PA 150–196
Род-Айленд РИ 028-029
Южная Каролина SC 290-299
Южная Дакота SD 570-577
Теннесси TN 370-385
Техас TX 733, 73949, 750-799, 885
Юта UT 840-847
Вермонт VT 050-054, 056-059
Вирджиния VA 20040-201нн, 20301, 20370, 220-246
Вашингтон WA 980-994
Западная Вирджиния WV 247-268
Висконсин WI 49936, 530-549
Вайоминг WY 820-831
Заграничные военные адреса
Заграничные военные адреса (APO или FPO) Аббревиатура Почтовый индекс
Европа, Ближний Восток, Африка и Канада AA 340nn
Америка (кроме Канады) AE 090-098
Pacific AP 962-66 98700
Владения Соединенных Штатов
Владения США ABBR Почтовый индекс
Американское Самоа КАК 96799
Федеративные Штаты Микронезии FM 96941-96944
Гуам ГУ 969
Маршалловы Острова MH 96960, 96970
Северный Марианский остров MP 96950-96952
Палау PW 96940
Пуэрто-Рико PR 006-007 009
Виргинские острова VI 008
Канадские провинции
Канадские провинции Аббревиатура
Альберта AB
Британская Колумбия до н. э.
Манитоба МБ
Нью-Брансуик NB
Ньюфаундленд NF
Северо-Западные территории NT
Новая Шотландия NS
Нунавут NU
Онтарио НА
Остров Принца Эдуарда PE
Квебек QC
Саскачеван SK
Территории Юкон YT

Раздел 8: Список округов Калифорнии

Правильно напишите следующие округа при идентификации недвижимого имущества, переданного на условное депонирование:

  • Аламеда
  • Альпийский
  • Амадор
  • Butte
  • Калаверас
  • Колуза
  • Contra Costa
  • Дель Норте
  • Эльдорадо
  • Фресно
  • Гленн
  • Гумбольдта
  • Имперская
  • Иньо
  • Керн
  • Короли
  • Озеро
  • Лассен
  • Лос-Анджелес
  • Мадера
  • Марин
  • Марипоса
  • Мендосино
  • Мерсед
  • Modoc
  • Моно
  • Монтерей
  • Напа
  • Невада
  • оранжевый
  • Россыпь
  • Сливы
  • Риверсайд
  • Сакраменто
  • Сан-Бенито
  • Сан-Бернардино
  • Сан-Диего
  • Сан-Франциско
  • Сан-Хоакин
  • Сан-Луис-Обиспо
  • Сан-Матео
  • Санта-Барбара
  • Санта-Клара
  • Санта-Крус
  • Шаста
  • Сьерра
  • Siskiyou
  • Солано
  • Сонома
  • Станислав
  • Саттер
  • Tehama
  • Тринити
  • Туларе
  • Туолумне
  • Вентура
  • Йоло
  • Юба

Раздел 9: Как передать заполненный файл SWIFT

Обзор

После того, как вы создадите файл, он готов к передаче нам через SWIFT. Вы должны ввести свой идентификатор пользователя и пароль, как описано в Разделе 2.

См. Руководство пользователя передатчика SWIFT для получения подробной информации о том, как войти в систему и передать файлы.

Структура файла передачи

Как указано в разделе 3, мы принимаем файлы в формате CSV. Назовите файл именем или фирменным наименованием налогового агента (например, johnsmithtitleco.csv).

Инструкции для пользователей Microsoft Excel :

  1. Введите все данные в книгу Excel и сохраните файл в формате CSV.
  2. Перед передачей файла в FTB загрузите инструмент SWIFT Validator и проверьте файл на отсутствие или недопустимость данных.
  3. Внесите исправления в файл в средстве проверки и повторно сохраните его в свой CSV-файл.
  4. Чтобы избежать ошибочного сокращения числа, которое начинается с нуля, не открывайте файл CSV повторно до передачи нам исправленного файла.

Ответ на получение

После того, как вы передадите нам файл SWIFT, используя свой почтовый ящик «ToFTB», вы получите квитанцию ​​на свой почтовый ящик «FromFTB».Квитанция содержит ваш идентификатор пользователя, дату и время получения файла, а также серийный номер для справки.

После того, как мы предоставим квитанцию, мы начинаем серию предварительной обработки данных, чтобы убедиться, что файл соответствует спецификациям. Как мы описываем ниже, вы получаете подтверждение (ACK), когда файл был предварительно обработан.

Дополнительные сведения см. В Руководстве пользователя передатчика SWIFT.

Раздел 10: Ответ ACK для файлов удержания недвижимости

После предварительной обработки файла, которая позволяет нам проверить содержимое файла, выполнив предварительное редактирование, вы получите ACK в своем почтовом ящике «FromFTB», в котором подробно описаны особенности файла. Кроме того, ACK уведомляет вас об ОШИБКАХ и ПРЕДУПРЕЖДЕНИЯХ.

В следующих примерах показаны типы и содержимое текстовых файлов ACK (.txt), которые вы можете получать. См. В разделе 12 подробные сведения о коде ПРЕДУПРЕЖДЕНИЯ и инструкции по исправлению ОШИБОК.

Пример # 1: Файл ПРИНЯТ

В этом примере ниже файл принят без предупреждений.

ДАТА ПОДТВЕРЖДЕНИЯ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjohnsmithtitleco.johnsmithtitleco.5022221.csv

Идентификатор SWIFT: wsjohnsmithtitleco

ПРИНЯТО: отправленный вами файл ПРИНЯТ для обработки.

Если у вас возникнут вопросы об общей сумме удержания по этому файлу, позвоните в Службу удержания налогов и нормативно-правового соответствия по телефону (888) 792-4900 или 916-845-4900.

Напоминание: удерживаемые платежи по недвижимому имуществу подлежат оплате 20 числа месяца, следующего за месяцем закрытия условного депонирования.

Пример выше определяется следующим образом:

Первый раздел содержит сведения об обработке вашего файла.

ДАТА ПОДТВЕРЖДЕНИЯ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjohnsmithtitleco.johnsmithtitleco.5022221.csv

Идентификатор SWIFT: wsjohnsmithtitleco

Во втором разделе указаны номера телефонов FTB, по которым можно обращаться с вопросами.

ПРИНЯТО: отправленный вами файл ПРИНЯТ для обработки.

Если у вас возникнут вопросы об общей сумме удержания по этому файлу, позвоните в Службу налогового удержания и контроля по телефону (888) 792-4900 или 916-845-4900.

Напоминание: удерживаемые платежи по недвижимости должны быть произведены до 20-го числа календарного месяца, следующего за месяцем закрытия условного депонирования.

Пример № 2: Файл ПРИНЯТ - ПРЕДУПРЕЖДЕНИЯ

В этом примере файл ПРИНЯТ.

Однако мы также предоставляем информационные ПРЕДУПРЕЖДЕНИЯ, указывающие на то, что определенная информация не была заполнена правильно.Мы внесли изменения в файл и по-прежнему ПРИНЯЛИ его, поэтому исправления от вас не требуются. Позвоните нам по телефону (888) 792-4900, если вы не согласны с нашими изменениями.

См. Раздел 12 для подробностей кода ПРЕДУПРЕЖДЕНИЯ и инструкций по исправлению ОШИБОК.

ДАТА ОБРАБОТКИ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoetitleco.janedoetitleco.1340030.csv

SWIFT ID: wsjanedoetitleco

ПРИНЯТО С ПРЕДУПРЕЖДЕНИЯМИ: отправленный вами файл ПРИНЯТ для обработки.Файл содержал неполную информацию. См. Публикацию FTB 923, Руководство по SWIFT для резидентов, нерезидентов и удержания налога на недвижимость, . Позвоните в FTB по телефону (888) 792-4900, чтобы исправить любые изменения, которые мы внесли в файл.

Если у вас возникнут вопросы об общей сумме удержания по этому файлу, позвоните в Службу налогового удержания и контроля по телефону (888) 792-4900 или 916-845-4900.

Напоминание: удерживаемые платежи по недвижимости должны быть произведены 20 числа месяца, следующего за месяцем закрытия условного депонирования.

ПРЕДУПРЕЖДЕНИЯ:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

(4,2): 221: ПРЕДУПРЕЖДЕНИЕ: Год налогообложения: Обязательное значение поля пусто. Значение «Налогового года» [2007] будет выведено из «Даты закрытия».

Пример выше определяется следующим образом:

Первый раздел содержит сведения об обработке вашего файла.

ДАТА ОБРАБОТКИ: 24. 08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoetitleco.janedoetitleco.1340030.csv

SWIFT ID: wsjanedoetitleco

Второй раздел содержит ПРЕДУПРЕЖДЕНИЕ и номера телефонов FTB, по которым можно обращаться с вопросами.

ПРИНЯТО С ПРЕДУПРЕЖДЕНИЯМИ: отправленный вами файл ПРИНЯТ для обработки. Файл содержал неполную информацию. Для получения помощи см. Публикацию FTB 923, Руководство по SWIFT для резидентов, нерезидентов и удержания удержания недвижимости . Позвоните в FTB по телефону (888) 792-4900, чтобы исправить любые изменения, которые мы внесли в файл.

Если у вас возникнут вопросы об общей сумме, удержанной для этого файла, позвоните в Службу удержания налогов и нормативно-правового соответствия по телефону: (888) 792-4900 или 916-845-4900.

Напоминание: удерживаемые платежи по недвижимости должны быть произведены 20 числа месяца, следующего за месяцем закрытия условного депонирования.

ПРЕДУПРЕЖДЕНИЯ: Информационный заголовок сообщает вам, как найти ОШИБКИ в вашем файле по строкам и столбцам в следующем формате:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

После этого заголовка мы объясняем ПРЕДУПРЕЖДЕНИЯ, относящиеся к отправленному вами файлу.

(4,2): 221: ПРЕДУПРЕЖДЕНИЕ: Год налогообложения: Обязательное значение поля пусто. Значение «Налогового года» [2007] будет выведено из «Даты закрытия».

Пример № 3: Файл отклонен - ​​ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ

В этом примере файл отклонен, потому что мы обнаружили ОШИБКИ с информацией, которую вы передали.

ОШИБКИ необходимо исправить и повторно передать файл . Файл не считается завершенным, пока мы не отправим вам ACK с подтверждением. Файл может также содержать ПРЕДУПРЕЖДЕНИЯ, которые следует просмотреть перед повторной передачей файла.

См. Раздел 12 для получения информации о кодах ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ, а также инструкции по исправлению ОШИБОК.

ДАТА ОБРАБОТКИ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoetitleco.janedoetitleco.5265744.csv

SWIFT ID: wsjanedoetitleco

ОБНАРУЖЕНА ОШИБКА: отправленный вами файл содержит ОШИБКИ.Исправьте ОШИБКИ, перечисленные ниже, и повторно отправьте файл.

ПРЕДУПРЕЖДЕНИЯ: Файл также содержал неполную информацию. Прочтите ПРЕДУПРЕЖДЕНИЯ ниже и исправьте предложенные изменения.

Этот файл не считается завершенным, пока мы не выдадим Подтверждение того, что файл ПРИНЯЛ. Обратитесь за помощью к публикации FTB 923, Руководству по SWIFT для резидентов, нерезидентов и удержания удержания недвижимости , или позвоните в FTB по телефону (888) 792-4900.

ОШИБКИ:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

(2,4): 12: ОШИБКА: Тип идентификатора: Обязательное поле пусто.

(2,3): 12: ОШИБКА: Идентификационный номер: Обязательное поле пусто.

(2,5): 522: ОШИБКА: Имя: Не были предоставлены поля имени «Физическое лицо» или «Другое».

ПРЕДУПРЕЖДЕНИЯ:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

(3,18): 11: ПРЕДУПРЕЖДЕНИЕ: Тип дохода: Поле пустое.Применение значения по умолчанию [...].

Пример выше определяется следующим образом:

Первый раздел содержит сведения об обработке вашего файла.

ДАТА ОБРАБОТКИ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoetitleco. janedoetitleco.5265744.csv

SWIFT ID: wsjanedoetitleco

Во втором разделе содержится информация об ОШИБКАХ и ПРЕДУПРЕЖДЕНИИ, а также номера телефонов FTB, по которым можно обращаться с вопросами.

ОБНАРУЖЕНА ОШИБКА: отправленный вами файл содержит ОШИБКИ. Исправьте ОШИБКИ, перечисленные ниже, и повторно отправьте файл.

ПРЕДУПРЕЖДЕНИЯ: Файл также содержал неполную информацию. Просмотрите ПРЕДУПРЕЖДЕНИЯ ниже и исправьте любые предложенные нами изменения.

Этот файл не считается завершенным до тех пор, пока мы не выдадим Подтверждение того, что файл ПРИНЯЛ. Обратитесь за помощью к публикации FTB 923, Руководству по SWIFT для резидентов, нерезидентов и удержания удержания недвижимости , или позвоните в FTB по телефону (888) 792-4900.

ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ: информационный заголовок сообщает вам, как найти ОШИБКИ в вашем файле по строкам и столбцам в следующем формате:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

После этого заголовка мы объясняем ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ, относящиеся к переданному вами файлу.

(2,3): 12: ОШИБКА: Идентификационный номер: Обязательное поле пусто.

(2,5): 522: ОШИБКА: Имя: Не были предоставлены поля имени «Физическое лицо» или «Другое».

(3,18): 11: ПРЕДУПРЕЖДЕНИЕ: Тип дохода: Поле пустое. Применение значения по умолчанию [...].

Раздел 11: Ответ ACK для файлов, удерживаемых резидентами и нерезидентами

После предварительной обработки файла, которая позволяет нам проверить содержимое файла, выполнив предварительное редактирование, вы получите ACK в свой почтовый ящик «FromFTB» с подробным описанием особенностей файла. Кроме того, ACK уведомляет вас об ОШИБКАХ и ПРЕДУПРЕЖДЕНИЯХ.

См. Раздел 12, в котором подробно описаны коды ПРЕДУПРЕЖДЕНИЙ и инструкции по исправлению ОШИБОК.

В следующих примерах показаны типы и содержимое текстовых файлов ACK (.txt), которые вы можете получить:

Пример # 1: Файл ПРИНЯТ

В этом примере файл ПРИНЯЛ без ПРЕДУПРЕЖДЕНИЙ:

ДАТА ПОДТВЕРЖДЕНИЯ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjohnsmithagent.johnsmithagent.5022221.csv

Идентификатор SWIFT: wsjohnsmithagent

ПРИНЯТО: отправленный вами файл ПРИНЯТ для обработки.

Если у вас возникнут вопросы об общей сумме удержания по этому файлу, позвоните в Службу удержания налогов и нормативно-правового соответствия по телефону: (888) 792-4900 или 916-845-4900.

Пример выше определяется следующим образом:

Первый раздел содержит сведения об обработке вашего файла.

ДАТА ПОДТВЕРЖДЕНИЯ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjohnsmithagent.johnsmithagent.5022221.csv

Идентификатор SWIFT: wsjohnsmithagent

Во втором разделе указаны номера телефонов FTB, по которым можно обращаться с вопросами.

ПРИНЯТО: отправленный вами файл ПРИНЯТ для обработки.

Если у вас возникнут вопросы об общей сумме удержания по этому файлу, позвоните в Службу налогового удержания и соответствия по телефону: (888) 792-4900 или (916) 845-4900.

Пример № 2: Файл ПРИНЯТ - ПРЕДУПРЕЖДЕНИЯ

В этом примере файл ПРИНЯТ.

Однако мы также предоставляем информационные ПРЕДУПРЕЖДЕНИЯ о том, что некоторая информация была заполнена неправильно.Мы по-прежнему ПРИНЯЛИ файл, и исправления не требуются, но вы можете позвонить нам по телефону (888) 792-4900 , если не согласны с нашими изменениями.

См. Раздел 12 для подробностей кода ПРЕДУПРЕЖДЕНИЯ и инструкций по исправлению ОШИБОК.

ДАТА ОБРАБОТКИ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoeagent.janedoeagent.1340030.csv

SWIFT ID: wsjanedoeagent

ПРИНЯТО С ПРЕДУПРЕЖДЕНИЯМИ: отправленный вами файл ПРИНЯТ для обработки.Файл содержал неполную информацию. См. Публикацию FTB 923, Руководство по SWIFT для резидентов, нерезидентов и удержания налога на недвижимость, . Позвоните в FTB по телефону (888) 792-4900, чтобы исправить любые изменения, которые мы внесли в файл.

Чтобы исправить любые изменения, внесенные FTB, или если у вас есть вопросы относительно общей суммы, удерживаемой для этого файла, позвоните в Службу удержания налогов и нормативно-правового соответствия по телефону: (888) 792-4900 или 916-845-4900.

ПРЕДУПРЕЖДЕНИЯ:

(3, 18): 11: ПРЕДУПРЕЖДЕНИЕ: Тип дохода: поле пустое.Применение значения по умолчанию […].

Пример выше определяется следующим образом:

Первый раздел содержит сведения об обработке вашего файла.

ДАТА ОБРАБОТКИ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoeagent.janedoeagent.1340030.csv

SWIFT ID: wsjanedoeagent

Во втором разделе указаны номера телефонов FTB, по которым можно обращаться с вопросами.

ПРИНЯТО С ПРЕДУПРЕЖДЕНИЯМИ: отправленный вами файл ПРИНЯТ для обработки. Файл содержал неполную информацию. См. Публикацию FTB 923, Руководство по SWIFT для резидентов, нерезидентов и удержания налога на недвижимость, .

Чтобы исправить любые изменения, внесенные FTB, или если у вас есть вопросы относительно общей суммы, удерживаемой для этого файла, позвоните в Службу удержания налогов и нормативно-правового соответствия по телефону: (888) 792-4900 или 916-845-4900.

ПРЕДУПРЕЖДЕНИЯ: Информационный заголовок сообщает вам, как найти ОШИБКИ в вашем файле по строкам и столбцам в следующем формате:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

После этого заголовка мы объясняем ПРЕДУПРЕЖДЕНИЯ, относящиеся к переданному вами файлу:

(3,18): 11: ВНИМАНИЕ: поле пустое. Применение значения по умолчанию […].

Пример № 3: Файл отклонен - ​​ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ

В этом примере файл отклонен, поскольку в нем были обнаружены ОШИБКИ.

Необходимо исправить ОШИБКИ и повторно передать файл . Файл не считается завершенным, пока мы не отправим ACK с подтверждением. Файл также может содержать ПРЕДУПРЕЖДЕНИЯ, которые следует просмотреть перед его повторной передачей.

См. Раздел 12 для получения информации о кодах ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ, а также инструкции по исправлению ОШИБОК.

ДАТА ОБРАБОТКИ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoeagent.janedoeagent.5265744.csv

SWIFT ID: wsjanedoeagent

ОБНАРУЖЕНА ОШИБКА: отправленный вами файл содержит ОШИБКИ. Исправьте
ОШИБКИ, перечисленные ниже, и повторно отправьте файл.

ПРЕДУПРЕЖДЕНИЯ: Файл также содержал неполную информацию. Пожалуйста, просмотрите
ПРЕДУПРЕЖДЕНИЯ ниже и исправьте любые предложенные нами изменения.

Этот файл не считается завершенным, пока мы не выдадим Подтверждение того, что файл ПРИНЯЛ.Обратитесь за помощью к публикации FTB 923, Руководству по SWIFT для резидентов, нерезидентов и удержания удержания недвижимости , или позвоните в FTB по телефону (888) 792-4900.

ОШИБКИ:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение
(2,4): 12: ОШИБКА: Тип идентификатора: Обязательное поле пусто.

(2,3): 12: ОШИБКА: Идентификационный номер: Обязательное поле пусто.

(2,5): 522: ОШИБКА: Имя: Не были предоставлены поля имени «Физическое лицо» или «Другое».ПРЕДУПРЕЖДЕНИЯ:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

(3,18): 11: ПРЕДУПРЕЖДЕНИЕ: Тип дохода: Поле пустое. Применение значения по умолчанию [...].

Пример выше определяется следующим образом:

Первый раздел содержит сведения об обработке вашего файла.

ДАТА ОБРАБОТКИ: 24.08.2007 10:31:31

ИМЯ ФАЙЛА: wsjanedoeagent.janedoeagent.5265744.csv

SWIFT ID: wsjanedoeagent

Второй раздел содержит информацию об ОШИБКАХ и ПРЕДУПРЕЖДЕНИИ, а также номера телефонов FTB, по которым можно позвонить, если возникнут вопросы.

ОБНАРУЖЕНА ОШИБКА: отправленный вами файл содержит ОШИБКИ. Исправьте ОШИБКИ, перечисленные ниже, и повторно отправьте файл.

ПРЕДУПРЕЖДЕНИЯ: Файл также содержал неполную информацию. Просмотрите ПРЕДУПРЕЖДЕНИЯ ниже и исправьте любые предложенные нами изменения.

Этот файл не считается завершенным, пока мы не выдадим Подтверждение того, что файл ПРИНЯЛ. Обратитесь за помощью к публикации FTB 923, Руководству по SWIFT для резидентов, нерезидентов и удержания удержания недвижимости , или позвоните в FTB по телефону (888) 792-4900.

Если у вас возникнут вопросы об общей сумме удержания по этому файлу, позвоните в Службу удержания налогов и нормативно-правового соответствия по телефону: (888) 792-4900 или 916-845-4900.

ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ: Информационный заголовок сообщает вам, как найти ОШИБКИ в вашем файле по строкам и столбцам в следующем формате:

(номер строки, номер столбца): Код ошибки: Тип ошибки: Имя столбца: Сообщение

После этого заголовка мы объясняем ОШИБКИ и ПРЕДУПРЕЖДЕНИЯ, относящиеся к отправленному вами файлу:

(2,4) 12: ОШИБКА: Тип идентификатора: Обязательное поле пусто.

(2,3): 12: ОШИБКА: Идентификационный номер: Обязательное поле пусто.

(2,5): 522: ОШИБКА: Имя: Не были предоставлены поля имени «Физическое лицо» или «Другое».

(3,18): 11: ПРЕДУПРЕЖДЕНИЕ: Тип дохода: Поле пустое. Применение значения по умолчанию […].

Раздел 12: Коды ошибок и ПРЕДУПРЕЖДЕНИЯ

Сообщения с кодом ошибки

Если ваш файл содержит ошибки, вы получите отклоненный ACK.ACK содержит конкретную информацию, которая поможет вам определить, где произошла ОШИБКА в переданном вами файле. Он включает данные, которые определяют номер строки и столбца вашего файла, код ОШИБКИ, тип ОШИБКИ и сообщение ОШИБКИ. Чтобы избежать отклонения файлов, просмотрите приведенную ниже таблицу со списком кодов ОШИБОК и сообщений ПРЕДУПРЕЖДЕНИЯ. Список также содержит подробную информацию о том, как исправить ОШИБКИ, которые мы определили в вашем ACK.

Вы должны исправить ОШИБКИ, прежде чем мы ПРИНЯТЬ файл в обработку.После исправления ОШИБОК повторно отправьте нам весь файл, используя свою учетную запись SWIFT, как описано в Разделе 9. Мы не будем считать ваш файл заполненным и зарегистрированным до тех пор, пока мы не отправим ACK с подтверждением принятия вашего файла.

Предупреждающие сообщения

Сообщения

WARNING предоставляют дополнительную информацию о том, что определенные данные в полях были изменены в соответствии с требованиями к данным. Нет необходимости исправлять сообщения WARNING для получения ACK с принятием вашего файла.Однако просмотрите сообщения ПРЕДУПРЕЖДЕНИЯ, которые вы получаете, чтобы убедиться, что изменение не повлияло на точность данных. Если у вас есть вопросы, позвоните нам по телефону (888) 792-4900.

Раздел 13: Коды ошибок и ПРЕДУПРЕЖДЕНИЯ Описание и исправления

Когда вы просматриваете и исправляете сообщения ОШИБКА и ПРЕДУПРЕЖДЕНИЕ, обратитесь к Публикации 1023R, Требования к электронному заявлению об удержании налогов в сфере недвижимости, и Публикации 1023S, Требования к электронному представлению налогов для резидентов и нерезидентов , где подробно описаны требования к форматированию данных.

Пример: ваш ACK будет содержать макет ниже, как мы показываем в Разделе 10 или Разделе 11, чтобы помочь вам найти ОШИБКИ и / или ПРЕДУПРЕЖДЕНИЯ в вашем файле:

Код ошибки
(№ строки, № столбца): Тип ошибки ColumnName Сообщение
(2,4): 12: ОШИБКА: ID Тип: Обязательное поле пусто.
(4,3): 322: ОШИБКА: ID номер: Поле «Идентификационный номер» пусто, поэтому значение поля «Тип идентификатора» [….] Также должно быть пустым.

Напоминание:

  • Вы должны исправить ОШИБКИ, прежде чем мы ПРИНЯЕМ файл для обработки.Прочтите ПРЕДУПРЕЖДЕНИЯ и свяжитесь с нами, если требуются исправления.
  • […] в сообщении обозначает информацию, которую мы дополним данными из отправленного вами файла.
Значение поля
Код ошибки Тип Имя поля / столбца Сообщение Описание Поправка
1 ПРЕДУПРЕЖДЕНИЕ Может применяться к нескольким Значение поля [. ..] не соответствует длине спецификации поля [...] и был усечен до [...].

Пример: Значение поля [Rumpelstiltskin] не соответствует длине спецификации поля [11] и было усечено до [rumpelstilt].

У некоторых полей есть спецификации, как мы показываем в Pub. 1023R или Pub. 1023S. В этом примере значение поля «Имя» не должно превышать 11 символов. Мы сократили значение поля до необходимого максимального количества символов.
2 ОШИБКА Может применяться к нескольким Значение поля [...] не соответствует формату спецификации поля.

Пример : Значение поля [john 7 ] не соответствует формату спецификации поля.

У некоторых полей есть спецификации, как мы показываем в Pub.1023R или Pub. 1023S. В этом примере значение поля «Имя» должно быть только альфа-каналом. При необходимости исправьте данные (например, Джон).
3 ОШИБКА Может применяться к нескольким Значение поля [...] не соответствует спецификации поля. Пожалуйста, проверьте длину и формат поля.

Пример : Значение поля [2008 8 ] не соответствует спецификации поля.Пожалуйста, проверьте длину и формат поля.

У некоторых полей есть спецификации, как мы показываем в Pub. 1023R или Pub. 1023S. В этом примере поле «Налоговый год» не должно содержать более четырех символов. Исправьте запись соответствующим образом (например, 2008 г.).
4 ПРЕДУПРЕЖДЕНИЕ Может применяться к нескольким Значение поля [. ..] отсутствует в списке допустимых значений и будет проигнорирован. Пожалуйста, проверьте список допустимых значений.

Пример : Значение поля [ XX ] отсутствует в списке допустимых значений и будет проигнорировано. Пожалуйста, проверьте список допустимых значений.

У некоторых полей есть определенные допустимые значения, как показано в разделах с 6 по 8. В этом примере поле «Состояние» содержит данные (XX), которые не распознаются как состояние или U.S. территория. Если адрес иностранный, оставьте это поле пустым. Сравните вашу запись с допустимыми значениями состояния в Разделе 7 (CA и т. Д.).
5 ПРЕДУПРЕЖДЕНИЕ Может применяться к нескольким Значение поля [...] отсутствует в списке допустимых значений, поэтому вместо него будет использоваться значение по умолчанию [...]. Пожалуйста, проверьте список допустимых значений.

Пример : значение поля [ тапочка ] отсутствует в списке допустимых значений, поэтому вместо него будет использоваться значение по умолчанию [продажа].Пожалуйста, проверьте список допустимых значений.

У некоторых полей есть определенные допустимые значения, как показано в разделах с 6 по 8. В этом примере поле «Тип транзакции» содержит данные (тапочка), которые не распознаются. Сравните свою запись с допустимыми значениями типа транзакции в Pub. 1023р. (Продажа, рассрочка, загрузка или обмен).
6 ПРЕДУПРЕЖДЕНИЕ Может применяться к нескольким Значение поля [...] отсутствует в списке допустимых значений, но значение [...] выглядит аналогичным и будет использоваться вместо него. Пожалуйста, проверьте список допустимых значений.

Real Estate Пример : значение поля [ Sn Diego] отсутствует в списке допустимых значений, но значение [San Diego] выглядит аналогичным и будет использоваться вместо него.

Пожалуйста, проверьте список допустимых значений.

Пример для нерезидента : значение поля [ Trst ] отсутствует в списке допустимых значений, но значение [Trust] выглядит аналогичным и будет использоваться вместо него.Пожалуйста, проверьте список допустимых значений.

У некоторых полей есть определенные допустимые значения, как мы показываем в разделах с 6 по 8. В примере с недвижимостью поле «Графство» содержит данные [Sn Diego], которые не признаны округом. В примере с нерезидентом поле «Тип дохода» содержит данные [Trst], которые не распознаются как тип дохода. Сравните свою запись с допустимыми значениями округа, как мы показываем в Разделе 8, или допустимыми значениями типа дохода, как мы показываем в Pub.1023S
11 ПРЕДУПРЕЖДЕНИЕ Может применяться к нескольким Поле пустое. Применение значения по умолчанию [...].

Пример : значение поля пустое. Применение значения по умолчанию [Продажа].

У некоторых полей есть определенные допустимые значения, как мы показываем в разделах с 6 по 8.В этом примере поле «Тип транзакции» не содержит данных. Сравните свою запись с допустимыми значениями типа транзакции в Pub. 1023R (Продажа, Рассрочка, Загрузка или Обмен).
12 ОШИБКА Может применяться к нескольким Обязательное поле пусто. Вы можете получить это сообщение, если поле пусто и мы не можем применить значение по умолчанию.Например, поле «Идентификационный номер» является обязательным полем для информации налогового агента. Чтобы исправить файл, добавьте в файл идентификационный номер.
90 ОШИБКА Может применяться к нескольким Недвижимость : количество столбцов в файле [...] меньше 30 обязательных столбцов.

Иногородний : количество столбцов в файле […] меньше требуемого 28 столбцов.

Real Estate Пример : количество столбцов в файле [25] меньше 30 обязательных столбцов.

Пример для нерезидента : количество столбцов в файле [25] меньше, чем 28 обязательных столбцов.

Убедитесь, что в файле есть все необходимые столбцы данных. Добавьте соответствующие столбцы и данные.
91 ОШИБКА Может применяться к нескольким Недвижимость : количество столбцов в файле, [...], больше 30 обязательных столбцов.

Иногородний : количество столбцов в файле […] превышает требуемые 28 столбцов.

Real Estate Пример : количество столбцов в файле [33] превышает 30 обязательных столбцов.

Пример для нерезидента : Количество столбцов в файле [33] превышает 28 обязательных столбцов.

Убедитесь, что в файле есть все необходимые столбцы данных. Удалите лишние столбцы, в том числе скрытые.
92 ОШИБКА Может применяться к нескольким Неожиданные данные были введены в строку налогового агента. Введите данные налоговой формы, начиная со строки 3 файла. Убедитесь, что строка содержит только информацию налогового агента.Строка 2 не должна содержать никакой информации, относящейся к продавцу недвижимости или получателю платежа, который получил доход нерезидента (например, номер участка, дата закрытия, тип дохода и т. Д.). Удалите любые из этих данных.
93 ОШИБКА Может применяться к нескольким Заголовок столбца [...] отличается от ожидаемого заголовка столбца [...].

Пример : Заголовок столбца [ID] отличается от ожидаемого заголовка столбца [Тип ID].

Измените имя указанного столбца, чтобы оно соответствовало имени столбца в Pub. 1023R или 1023S. В этом примере измените имя столбца на «Тип идентификатора».
94 ОШИБКА Может применяться к нескольким Для обработки отправлено недостаточно данных. Файл должен содержать одну строку данных налогового агента и минимум одну строку данных налогоплательщика. Добавьте необходимые данные налогового агента и / или хотя бы одну строку данных продавца недвижимости или данных получателя-нерезидента.
95 ОШИБКА Может применяться к нескольким Файл не содержит данных. Добавьте необходимые данные налогового агента и хотя бы одну строку данных продавца недвижимости или данных получателя-нерезидента.
96 ОШИБКА Может применяться к нескольким Остаток к уплате […] превышает 9 999 999 999,99. Пожалуйста, проверьте значения поля «Удержанная сумма».

Пример : Сумма задолженности [10,000,000,000.00] превышает 9 999 999 999,99. Пожалуйста, проверьте значения поля «Удержанная сумма».

Убедитесь, что все значения в поле «Удержанная сумма» соответствуют фактическим суммам, удержанным во время каждой операции с недвижимостью.
221 ПРЕДУПРЕЖДЕНИЕ Налоговый год Обязательное значение поля пусто. Значение «Налогового года» [...] будет выведено из «Даты закрытия».

Пример : Обязательное значение поля пусто. Значение «налогового года» [2008] будет выведено из «Даты закрытия».

Убедитесь, что «налоговый год» совпадает с годом «даты закрытия» для всех продавцов, перечисленных в файле.Каждый файл допускает только один налоговый год.
222 ПРЕДУПРЕЖДЕНИЕ Налоговый год Обязательное значение поля пусто. Значение «налогового года» […] будет выведено из первой записи налогового года.

Пример : Обязательное значение поля пусто. Значение «Налогового года» [2008] будет выведено из первой записи налогового года.

Убедитесь, что «Налоговый год» одинаков для всех получателей платежей, указанных в файле.
251 ОШИБКА Налоговый год Значение поля [...] не согласуется с предыдущими записями, в которых указан «налоговый год» [...].

Пример : значение поля [2007] не согласуется с предыдущими записями, которые указывают «налоговый год» [2008].

Каждый файл может содержать только один налоговый год. Отправляйте отдельные файлы, если вам нужно передать данные за более чем один налоговый год.
252 ПРЕДУПРЕЖДЕНИЕ Налоговый год Значение поля [...] недопустимо, поэтому значение поля «Налоговый год» будет изменено с […] на […].

Пример : значение поля [200 B ] недействительно, поэтому значение поля «Налоговый год» будет изменено с [200 B ] на [2008].

Введите четырехзначный год, когда была удержана сумма. Используйте только числовые символы. Отформатируйте «Налоговый год», как мы показываем в Pub. 1023S. Каждый файл допускает только один налоговый год.
321 ОШИБКА ID ТИП Поле «Идентификационный номер» должно состоять из 9 цифр, если «Тип идентификатора» - SSN / ITIN, TPID или FEIN, и 7 цифр, если используется CACORP. Включите действительный идентификационный номер, чтобы иметь действительный тип идентификатора.
322 ОШИБКА ID ТИП Поле «Идентификационный номер» пустое, поэтому значение поля «Тип идентификатора» [...] также должно быть пустым. Для определения типа идентификатора необходимо указать действительный идентификационный номер. Если вы не знаете идентификационный номер, оставьте оба поля пустыми.
405 ОШИБКА ID Тип Значение поля […] - недопустимое значение. Проверьте список допустимых значений. Тип идентификатора должен быть SSN, ITIN, FEIN, CA SOS.
406 ПРЕДУПРЕЖДЕНИЕ Супруг / Тип ID RDP Значение поля […] отсутствует в списке допустимых значений, но значение […] выглядит аналогичным и будет использоваться вместо него.Пожалуйста, проверьте список допустимых значений. Тип идентификатора должен быть SSN, ITIN, FEIN, CA SOS.
412 ОШИБКА ID ТИП Обязательное поле пусто. Тип идентификатора должен быть SSN, ITIN, FEIN, CA SOS.
521 ОШИБКА Имя Были предоставлены поля имен «Индивидуальное» и «Другое». Включите в файл данные только в поля имени «Индивидуальное» или «Другое», но не в оба поля одновременно. Проверьте имена и удалите одно или другое.
522 ОШИБКА Имя Не были предоставлены поля имени «Физическое лицо» или «Другое». Необходимо указать имя «Физическое лицо» или «Другое».
523 ОШИБКА Имя Поле «Имя» не может быть пустым, если вводится индивидуальное имя. Если вы включаете данные «Фамилия» в файл для продавца, получателя платежа или налогового агента, вы также должны включить данные «Имя» для того же продавца, получателя платежа или налогового агента. При необходимости добавьте имя.
524 ОШИБКА Имя Поле «Фамилия» не может быть пустым, если вводится индивидуальное имя. Если вы включаете данные «Имя» в файл для продавца, получателя платежа или налогового агента, вы также должны включить данные «Фамилия» для того же продавца, получателя платежа или налогового агента. При необходимости добавьте фамилию.
525 ПРЕДУПРЕЖДЕНИЕ Имя Поле «Другая строка имени 1» было пустым, но поле «Другая строка имени 2» содержало значение. Используйте поле «Другая строка имени 2» только в том случае, если имя не помещается в «Строку другого имени 1».
526 ОШИБКА ID Тип Поле «Тип идентификатора» не может быть FEIN, CACORP или SOSL, когда вводится индивидуальное имя. Если вы включаете данные «Имя» или «Фамилия» в файл для продавца, получателя платежа или налогового агента, тогда «Тип идентификатора» для этого лица должен быть SSN или ITIN.
527 ОШИБКА ID Тип В поле «Тип идентификатора» должно быть указано FEIN, CACORP или CASOS, когда введены «Строка другого имени 1» или «Строка другого имени 2». Если вы включаете данные «Строка другого имени 1» или «Строка другого имени 2» в файл для продавца, получателя платежа или налогового агента, тогда «Тип идентификатора» должен быть FEIN, CA CORP или CASOS для этого продавца, получатель платежа или налоговый агент. Другие строки имени 1 и 2 используются только для имен сущностей. (например, Бизнес, ООО, Траст, не предоставляющий право, Партнерство) У организации нет SSN, у организаций есть один или несколько из следующих типов идентификаторов: FEIN, CACORP или CASOS.
528 ОШИБКА ID Тип Поле «Тип идентификатора» не может быть SSN, если имя подразумевает доверие. Если данные в «Строке другого имени 1» или «Строке другого имени 2» предполагают доверие (т.е. слово «доверие» присутствует в названии), тогда «Тип идентификатора» должен быть FEIN, CACORP или CASOS.
1021 ОШИБКА Супруг / идентификационный номер RDP Поле «Идентификационный номер супруга / RDP» должно состоять из 9 цифр, если «Тип идентификатора супруга / RDP» - SSN / ITIN. Идентификационный номер супруга / супруги / RDP должен содержать 9 цифр, если указан SSN или ITIN.
1111 ПРЕДУПРЕЖДЕНИЕ Супруг / Тип ID RDP Поле пустое.Применение значения по умолчанию [Нет]. Если супруг / супруга / RDP не введены, это поле должно быть пустым.
1223 ОШИБКА Супруг / РДП Имя Поле «Супруг / имя RDP» не может быть пустым, если поле «Супруг / фамилия RDP» имеет значение. Если вы включаете данные «Супруга / имя RDP» в файл для продавца, вы должны включить данные «Супруга / Фамилия RDP» для того же продавца. Добавьте имя супруга / RDP в поле «Имя супруга / RDP».
1224 ОШИБКА Супруг / РДП Имя Поле «Супруг / фамилия RDP» не может быть пустым, если поле «Супруг / имя RDP» имеет значение. Если вы включаете данные «Супруга / Фамилия RDP» в файл для продавца, вы должны включить данные «Супруга / Фамилия RDP» для того же продавца.Добавьте фамилию супруга / RDP в поле «Фамилия супруга / RDP».
1226 ПРЕДУПРЕЖДЕНИЕ Супруг / Тип ID RDP Поле «Тип идентификатора супруга / RDP» должно быть SSN, ITIN или оставаться пустым. Тип идентификатора супруга / RDP может быть только SSN или ITIN. Если супруга / RDP не введены, это поле должно оставаться пустым.
1304 ОШИБКА Государство Значение поля […] - недопустимое значение.Проверьте список допустимых значений. State должно содержать внутренний штат США или оставаться пустым, если адрес является иностранным.
1611 ПРЕДУПРЕЖДЕНИЕ Страна Поле пустое. Применение значения по умолчанию [ USA ]. Проверьте страну и позвоните нам по телефону (888) 792-4900, чтобы внести исправления.
1704 ОШИБКА Внутренний квартал Значение поля […] - недопустимое значение. Проверьте список допустимых значений. Каждый файл может содержать только один внутренний квартал. Допустимые значения поля «Внутренний квартал»: 1, 2, 3 или 4.
1821 ОШИБКА Вид дохода Записи в полях «Тип дохода» содержат типы внутреннего и внешнего дохода. Каждый файл может содержать только один тип дохода, внутренний или иностранный. Если вам необходимо предоставить данные для обоих типов доходов, вы должны представить их в двух отдельных файлах.
1922 ОШИБКА Доход, подлежащий удержанию Общая сумма «дохода, подлежащего удержанию» [...] превышает 9 999 999 999,99. Пожалуйста, проверьте значения этого поля.

Пример : Общая сумма «дохода, подлежащего удержанию» в размере [10,000,000,000.00] превышает 9 999 999 999,99. Пожалуйста, проверьте значения этого поля.

Убедитесь, что все значения в указанном поле являются суммами, предназначенными для файла.
2003 ОШИБКА Удержанная сумма Значение поля [0.000] не соответствует спецификации поля. Пожалуйста, проверьте длину и формат поля. Убедитесь, что все значения в указанном поле являются суммами, предназначенными для файла.
2021 ОШИБКА Удержанная сумма Поле «Удержанная сумма» содержит нулевую сумму в долларах. Поле «Удержанная сумма» не может содержать нулевую сумму в долларах. Если налог не удерживался, удалите получателя платежа из файла. Если налог был удержан, добавьте удержанную сумму налога.
2022 ОШИБКА Удержанная сумма Общая «удержанная сумма» [...] превышает 9 999 999 999,99. Пожалуйста, проверьте значения в этом поле.

Пример : Общая «Удержанная сумма» [10,000,000,000.00] превышает 9 999 999 999,99. Пожалуйста, проверьте значения этого поля.

Убедитесь, что все значения в указанном поле являются суммами, предназначенными для файла.
2221 ОШИБКА Номер посылки Ни поля «Номер участка», ни «Адрес собственности» не были предоставлены. Укажите «Номер участка» или «Адрес собственности» для каждой продажи.Добавьте один или другой в файл.
2421 ПРЕДУПРЕЖДЕНИЕ Внешний остаток к уплате Сумма […] в поле «Причитающееся внешнее сальдо» не соответствует нашему расчету […], а «Причитающееся внешнее сальдо» было изменено на […].

Пример : Сумма [2000 долларов] в поле «Причитающийся внешний остаток» не соответствует нашему расчету [1000 долларов], а «Причитающийся внешний остаток» изменен на [1000 долларов].

Мы сравнили запись для этого поля с суммой, рассчитанной на основе наших записей. Поскольку суммы не совпадают, мы заменили введенную запись суммой, рассчитанной на основе наших записей. Проверьте свои записи на сумму и позвоните нам по телефону (888) 792-4900, чтобы внести исправления.
2521 ПРЕДУПРЕЖДЕНИЕ Иностранная переплата Сумма […] в поле «Иностранная переплата» не соответствует нашему расчету […], а «Иностранная переплата» изменена на […].

Пример : Сумма [2000 долларов] в поле «Иностранная переплата» не соответствует нашему расчету [1000 долларов], а «Иностранная переплата» изменена на [1000 долларов].

Мы сравнили запись для этого поля с суммой, рассчитанной на основе наших записей. Поскольку суммы не совпадают, мы заменили введенную запись суммой, рассчитанной на основе наших записей. Проверьте свои записи на сумму и позвоните нам по телефону (888) 792-4900, чтобы внести исправления.
2522 ОШИБКА Иностранная переплата Поле «Внешняя переплата» не может содержать сумму, если «Внешняя переплата» содержит сумму. Файл не может содержать одновременно «Причитающийся иностранный остаток» и «Иностранную переплату». Проверьте свои записи и исправьте файл соответствующим образом.
2621 ПРЕДУПРЕЖДЕНИЕ Иностранный кредит до следующего года Сумма […] в поле «Иностранный кредит до следующего года» превышает рассчитанную «Внешнюю переплату» […], а «Иностранный кредит до следующего года» изменен на […].

Пример : Сумма [1000 долларов] в поле «Иностранный кредит до следующего года» превышает рассчитанную «Иностранную переплату» в [800 долларов], а «Иностранный кредит до следующего года» изменен на [800 долларов].

В этом примере система рассчитала «Внешнюю переплату» меньше, чем запись в «Иностранный кредит до следующего года». В результате мы уменьшили «Иностранный кредит до следующего года», чтобы он соответствовал рассчитанной нами доступной сумме.Проверьте свои записи на суммы и позвоните нам по телефону (888) 792-4900, чтобы внести исправления.
2622 ПРЕДУПРЕЖДЕНИЕ Иностранный кредит до следующего года Рассчитанная сумма «иностранной переплаты» в […] превышает поле «Иностранный кредит до следующего года» […], а «Внешний кредит до следующего года» изменен на […].

Пример : Расчетная сумма «иностранной переплаты» в [1000 долларов] превышает поле «Внешний кредит до следующего года», равное [800 долларов], а «Внешний кредит до следующего года» изменен на [1000 долларов].

В этом примере у агента не было указано «Возврат иностранного платежа» в его файле, и вся его иностранная переплата должна быть зачислена на следующий год. В этом случае мы увеличили «Иностранный кредит до следующего года», чтобы он соответствовал рассчитанной нами доступной сумме. Проверьте свои записи на суммы и позвоните нам по телефону (888) 792-4900, чтобы внести изменения.
2623 ОШИБКА Иностранный кредит до следующего года Поле «Внешний кредит до следующего года» не может содержать сумму, если «Внешний остаток к оплате» содержит сумму. Если файл содержит запись в «Причитающийся иностранный остаток», тогда файл не может содержать запись в «Зарубежный кредит до следующего года», поскольку, согласно файлу, нет «Иностранной переплаты», позволяющей зачислить на счету кредит.
2721 ОШИБКА Дата закрытия Налоговый год [...] поля «Дата закрытия» не соответствует значению [...] поля «Налоговый год».

Пример : Налоговый год [2007] поля «Дата закрытия» не соответствует значению [2008] поля «Налоговый год».

Налоговый год всегда должен совпадать с годом даты закрытия. Проверьте дату закрытия и убедитесь, что налоговый год совпадает. Каждый файл может содержать только один налоговый год. Отправляйте отдельные файлы, если вам нужно предоставить данные за более чем один налоговый год.
2722 ОШИБКА Дата закрытия Поле «Дата закрытия» содержит недопустимую дату [...].

Пример : поле «Дата закрытия» содержит недопустимую дату [31.02.2007].

Включите действительный месяц, день и год в поле «Дата закрытия». Например, в феврале всего 28 дней (29 в високосном году). Проверьте дату закрытия и при необходимости измените.
2723 ПРЕДУПРЕЖДЕНИЕ Возврат иностранной валюты Поле «Возврат за границу» […] превышает рассчитанное «Возврат за границу» в […], а «Возврат за границу» было изменено на […].

Пример : Поле «Возврат за границу» [1000 долларов] превышает рассчитанное «Возврат за границу» в [800 долларов], а «Возврат за границу» изменено на [800 долларов].

В этом примере система рассчитала «Возврат из-за границы» меньше, чем «Возврат из-за границы», указанный в файле. «Зарубежный возврат» был изменен в соответствии с нашими расчетами. В этом примере агент получает меньшую сумму возмещения, чем ожидалось. Проверьте свои записи на суммы и позвоните нам по телефону (888) 792-4900, чтобы внести исправления.
2724 ПРЕДУПРЕЖДЕНИЕ Возврат иностранной валюты Рассчитанная сумма «Возврата за границу» в […] превышает поле «Возврат за границу» в […], а «Возврат за границу» изменен на […].

Пример : Рассчитанная сумма «Возврата за границу» в [1000 долларов] превышает поле «Возврат за границу» на [800 долларов], а «Зарубежный возврат» изменен на [1000 долларов].

В этом примере рассчитанный системой «внешний возврат» больше, чем «зарубежный возврат», указанный в файле. «Зарубежный возврат» был изменен в соответствии с нашими расчетами. В этом примере агент получает более крупный возврат в результате наших расчетов. Проверьте свои записи на суммы и позвоните нам по телефону (888) 792-4900, чтобы внести исправления.
2725 ОШИБКА Возврат иностранной валюты Поле «Возврат за границу» не может содержать сумму, если «Причитающийся за рубежом остаток» содержит сумму. Если файл содержит запись в «Причитающийся иностранный остаток», тогда файл не может содержать запись в «Зарубежный возврат», потому что, согласно файлу, нет «Иностранной переплаты», позволяющей осуществить возврат на счет.
2905 ПРЕДУПРЕЖДЕНИЕ Расчет удержания Значение поля [] отсутствует в списке допустимых значений, поэтому мы используем значение по умолчанию [.0333] вместо этого. Проверьте список допустимых значений. Введите одно из допустимых значений, как описано в Pub. 1023S.
3021 ПРЕДУПРЕЖДЕНИЕ Удержанная сумма Поле «Удержанная сумма» не может содержать нулевую сумму в долларах. Если налог не удерживался, удалите получателя платежа из файла. Форма 593 подается, когда удержание было произведено для продавца.Если налог был удержан, введите сумму удержанного налога.

Раздел 14. Свяжитесь с нами

Для получения технической поддержки SWIFT (проблемы с идентификатором пользователя и паролем) обратитесь к часто задаваемым вопросам SWIFT или позвоните по телефону (916) 845-3778.

Электронная почта
[email protected]
Телефон
(888) 792-4900 с 8:00 до 17:00 по будням, кроме государственных праздников
(916) 845-4900 из-за пределов США

Глава 2 Основы R | Введение в науку о данных

В этой книге мы будем использовать программную среду R для всех наших анализ.Вы одновременно изучите R и методы анализа данных. Поэтому для продолжения вам потребуется доступ к R. Мы также рекомендуем использовать интегрированную среду разработки (IDE), такую ​​как RStudio, для сохранения вашей работы. Обратите внимание, что в рамках курса или семинара обычно предлагается доступ к среде R и IDE через ваш веб-браузер, как это делает облако RStudio. Если у вас есть доступ к такому ресурсу, вам не нужно устанавливать R и RStudio. Однако, если вы собираетесь стать опытным аналитиком данных, мы настоятельно рекомендуем установить эти инструменты на свой компьютер.И R, и RStudio бесплатны и доступны в Интернете.

Пример: убийства с применением огнестрельного оружия в США

Представьте, что вы живете в Европе, и вам предлагают работу в американской компании с офисами во всех штатах. Это отличная работа, но новости с такими заголовками, как « Уровень убийств с применением огнестрельного оружия в США выше, чем в других развитых странах », вызывают у вас беспокойство. Такие графики могут вас заинтересовать еще больше:

Или, что еще хуже, эта версия с everytown.org:

Но тогда вы помните, что США - большая и разнообразная страна с 50 очень разными штатами, а также округом Колумбия (округ Колумбия).

В Калифорнии, например, население больше, чем в Канаде, а в 20 штатах США проживает больше населения, чем в Норвегии. В некотором отношении изменчивость между штатами США сродни изменчивости в разных странах Европы. Более того, хотя это и не вошло в таблицы выше, уровень убийств в Литве, Украине и России превышает 4 на 100 000 человек. Так что, возможно, сообщения новостей, которые вас беспокоят, слишком поверхностны. У вас есть выбор, где жить, и вы хотите определить безопасность каждого конкретного штата.Мы получим некоторую информацию, изучив данные, связанные с убийствами с применением огнестрельного оружия в США в течение 2010 года с использованием R.

Прежде чем мы начнем с нашего примера, нам нужно охватить логистику, а также некоторые из самых основных строительных блоков, которые требуются для получения более продвинутых навыков R. Имейте в виду, что полезность некоторых из этих строительных блоков может быть не сразу очевидна, но позже в книге вы оцените овладение этими навыками.

Основы

Прежде чем мы начнем с набора мотивирующих данных, нам нужно охватить самые основы R.2 + x -1 = 0 \), то определяем:

, в котором хранятся значения для последующего использования. Мы используем <- для присвоения значений переменным.

Мы также можем присвоить значения, используя = вместо <- , но мы не рекомендуем использовать = , чтобы избежать путаницы.

Скопируйте и вставьте приведенный выше код в консоль, чтобы определить три переменные. Обратите внимание, что R ничего не печатает, когда мы выполняем это присваивание. Это означает, что объекты были определены успешно.Если бы вы сделали ошибку, вы бы получили сообщение об ошибке.

Чтобы увидеть значение, хранящееся в переменной, мы просто просим R оценить a , и он показывает сохраненное значение:

Более явный способ попросить R показать нам значение, хранящееся в a , использует print следующим образом:

Мы используем термин объект для описания того, что хранится в R. Переменные являются примерами, но объекты также могут быть более сложными объектами, такими как функции, которые описаны позже.

Рабочее пространство

Когда мы определяем объекты в консоли, мы фактически меняем рабочую область . Вы можете увидеть все переменные, сохраненные в вашем рабочем пространстве, набрав:

  лс ()
#> [1] "a" "b" "c" "dat" "img_path" "убийства"  

В RStudio вкладка Environment показывает значения:

Мы должны увидеть a , b и c . Если вы попытаетесь восстановить значение переменной, которой нет в вашей рабочей области, вы получите сообщение об ошибке.2-4 * а * в)) / (2 * а) #> [1] -1,62

Функции

После определения переменных процесс анализа данных обычно можно описать как серию из функций , применяемых к данным. R включает в себя несколько предопределенных функций, и большинство построенных нами конвейеров анализа широко их используют.

Мы уже использовали функции install.packages , library и ls . Мы также использовали функцию sqrt для решения квадратного уравнения выше.Есть еще много готовых функций, и еще больше можно добавить с помощью пакетов. Эти функции не отображаются в рабочей области, потому что вы не определили их, но они доступны для немедленного использования.

Как правило, нам нужно использовать круглые скобки для оценки функции. Если вы наберете ls , функция не будет оцениваться, и вместо этого R покажет вам код, определяющий функцию. Если вы наберете ls () , функция будет оценена, и, как показано выше, мы увидим объекты в рабочей области.

В отличие от ls , большинству функций требуется один или несколько аргументов . Ниже приведен пример того, как мы назначаем объект аргументу функции log . Помните, что ранее мы определили как как 1:

.
  журнал (8)
#> [1] 2,08
журнал (а)
#> [1] 0  

Вы можете узнать, что функция ожидает и что она делает, просмотрев очень полезные руководства, включенные в R. Вы можете получить помощь, используя функцию help , например:

Для большинства функций мы также можем использовать это сокращение:

Страница справки покажет вам, какие аргументы ожидает функция.Например, для журнала log требуется x и base для запуска. Однако некоторые аргументы являются обязательными, а другие - необязательными. Вы можете определить, какие аргументы являются необязательными, отметив в справочном документе, что значение по умолчанию присвоено = . Их определение необязательно. Например, основание функции log по умолчанию равно base = exp (1) , что делает log натуральным логарифмом по умолчанию.

Если вы хотите быстро просмотреть аргументы, не открывая справочную систему, введите:

  аргументов (журнал)
#> function (x, base = exp (1))
#> ПУСТО  

Вы можете изменить значения по умолчанию, просто назначив другой объект:

  журнал (8, основание = 2)
#> [1] 3  

Обратите внимание, что мы не указывали аргумент x как таковой:

  журнал (x = 8, основание = 2)
#> [1] 3  

Приведенный выше код работает, но мы можем сэкономить на вводе: если имя аргумента не используется, R предполагает, что вы вводите аргументы в порядке, указанном в файле справки, или args .Поэтому, не используя имена, предполагается, что аргументы - x , за которыми следует основание :

.

Если использовать имена аргументов, мы можем включать их в любом порядке:

  журнал (основание = 2, x = 8)
#> [1] 3  

Чтобы указать аргументы, мы должны использовать = и не можем использовать <- .

Есть некоторые исключения из правила, согласно которому функции нуждаются в скобках для оценки. Среди них наиболее часто используются арифметические и реляционные операторы.Например:

Вы можете увидеть арифметические операторы, набрав:

или

и реляционные операторы, набрав:

или

Прочие готовые объекты

Есть несколько наборов данных, которые можно использовать для практики и тестирования функций. Вы можете увидеть все доступные наборы данных, набрав:

Здесь отображается имя объекта для этих наборов данных. Эти наборы данных представляют собой объекты, которые можно использовать, просто введя имя. Например, если вы наберете:

R покажет вам данные о концентрации CO2 в атмосфере на острове Мауна-Лоа.

Другие готовые объекты представляют собой математические величины, например константу \ (\ pi \) и \ (\ infty \):

  пи
#> [1] 3.14
Inf + 1
#> [1] Inf  

Имена переменных

Мы использовали буквы a , b и c в качестве имен переменных, но имена переменных могут быть практически любыми. Некоторые основные правила в R заключаются в том, что имена переменных должны начинаться с буквы, не могут содержать пробелов и не должны быть переменными, предопределенными в R.2-4 * а * в)) / (2 * а)

Чтобы получить дополнительные советы, мы настоятельно рекомендуем изучить руководство по стилю Хэдли Уикхэм.

Сохранение рабочего места

Значения остаются в рабочей области до тех пор, пока вы не завершите сеанс или не удалите их с помощью функции rm . Но рабочие места также можно сохранить для дальнейшего использования. Фактически, когда вы выходите из R, программа спрашивает вас, хотите ли вы сохранить рабочее пространство. Если вы все же сохраните его, при следующем запуске R программа восстановит рабочее пространство.

На самом деле мы не рекомендуем сохранять рабочее пространство таким образом, потому что, когда вы начнете работать над разными проектами, будет труднее отслеживать, что сохраняется.Вместо этого мы рекомендуем вам присвоить рабочему пространству конкретное имя. Это можно сделать с помощью функции save или save.image . Для загрузки используйте функцию load . При сохранении рабочего пространства мы рекомендуем суффикс rda или RData . В RStudio вы также можете сделать это, перейдя на вкладку Session и выбрав Save Workspace as . Позже вы можете загрузить его, используя параметры Load Workspace на той же вкладке. Вы можете прочитать страницы справки по save , save.2-4 * а * в)) / (2 * а)

Создав и сохранив сценарий с приведенным выше кодом, нам не нужно каждый раз вводить все заново, а вместо этого просто менять имена переменных. Попробуйте написать приведенный выше сценарий в редакторе и обратите внимание, как легко изменить переменные и получить ответ.

Упражнения

1. Какова сумма первых 100 натуральных чисел? Формула суммы целых чисел от \ (1 \) до \ (n \) равна \ (n (n + 1) / 2 \). Определите \ (n = 100 \), а затем используйте R, чтобы вычислить сумму от \ (1 \) до \ (100 \), используя формулу.Какая сумма?

2. Теперь используйте ту же формулу для вычисления суммы целых чисел от 1 до 1000.

3. Посмотрите на результат ввода следующего кода в R:

  п <- 1000
х <- seq (1, n)
сумма (x)  

На основании результата, что, по вашему мнению, делают функции seq и sum ? Вы можете использовать справку .

  1. sum создает список чисел, а seq складывает их.
  2. seq создает список чисел, а сумма складывает их.
  3. seq создает случайный список, а sum вычисляет сумму от 1 до 1000.
  4. Сумма всегда возвращает одно и то же число.

4. В математике и программировании мы говорим, что вычисляем функцию, когда заменяем аргумент заданным числом. Итак, если мы введем sqrt (4) , мы оценим функцию sqrt . В R вы можете оценивать функцию внутри другой функции. Оценки происходят изнутри. Используйте одну строку кода, чтобы вычислить журнал квадратного корня из 100 по основанию 10.10)

  • журнал (exp (x))
  • ехр (журнал (x, основание = 2))
  • Типы данных

    Переменные в R могут быть разных типов. Например, нам нужно отличать числа от символьных строк, а таблицы от простых списков чисел. Функция class помогает нам определить, какой у нас тип объекта:

      а <- 2
    класс (а)
    #> [1] "numeric"  

    Для эффективной работы в R важно изучить различные типы переменных и то, что мы можем с ними делать.

    Кадры данных

    До сих пор переменные, которые мы определили, представляют собой только одно число. Это не очень полезно для хранения данных. Наиболее распространенный способ хранения набора данных в R - во фрейме данных . Концептуально мы можем рассматривать фрейм данных как таблицу со строками, представляющими наблюдения, и различными переменными, сообщаемыми для каждого наблюдения, определяющего столбцы. Фреймы данных особенно полезны для наборов данных, потому что мы можем объединять разные типы данных в один объект.

    Большая часть задач анализа данных начинается с данных, хранящихся во фрейме данных. Например, мы сохранили данные для нашего мотивирующего примера во фрейме данных. Вы можете получить доступ к этому набору данных, загрузив библиотеку dslabs и загрузив набор данных убийств с помощью функции data :

      библиотека (dslabs)
    данные (убийства)  

    Чтобы увидеть, что это на самом деле фрейм данных, мы набираем:

      класс (убийства)
    #> [1] "данные.рама " 

    Осмотр объекта

    Функция str полезна для получения дополнительной информации о структуре объекта:

     ул.  (убийства)
    #> 'data.frame': 51 набл. из 5 переменных:
    #> $ state: chr "Алабама" "Аляска" "Аризона" "Арканзас" ...
    #> $ abb: chr "AL" "AK" "AZ" "AR" ...
    #> $ region: множитель с 4 уровнями «Северо-восток», «Юг», ..: 2 4 4 2 4 4 1 2 2
    #> 2 ...
    #> $ Population: num 4779736 710231 63 28 37253956...
    #> $ total: num 135 19 232 93 1257 ...  

    Это говорит нам гораздо больше об объекте. Мы видим, что в таблице 51 строка (50 состояний плюс DC) и пять переменных. Мы можем показать первые шесть строк с помощью функции head :

      головы (убийства)
    #> штат абб область население всего
    #> 1 Алабама Аль-Южный 4779736 135
    #> 2 Аляска АК Запад 710231 19
    #> 3 Аризона, Аризона, Запад 63 232
    #> 4 Арканзас, Южный округ, 28 93
    #> 5 Калифорния Западная Калифорния 37253956 1257
    #> 6 Колорадо Колорадо Запад 5029196 65  

    В этом наборе данных каждое состояние считается наблюдением, и для каждого состояния сообщается пять переменных.

    Прежде чем мы продолжим отвечать на наш исходный вопрос о различных состояниях, давайте узнаем больше о компонентах этого объекта.

    Аксессуар:

    $

    Для нашего анализа нам потребуется доступ к различным переменным, представленным столбцами, включенными в этот фрейм данных. Для этого воспользуемся оператором доступа $ следующим образом:

      убийств $ населения
    #> [1] 4779736 710231 63 28 37253956 5029196 3574097
    #> [8] 897934 601723 19687653 90 1360301 1567582 12830632
    #> [15] 6483802 3046355 2853118 4339367 4533372 1328361 5773552
    #> [22] 6547629 9883640 5303925 2967297 5988927 989415 1826341
    #> [29] 2700551 1316470 87 2059179 1

    02
    83 672591 #> [36] 11536504 3751351 3831074 12702379 1052567 4625364 814180 #> [43] 6346105 25145561 2763885 625741 8001024 6724540 1852994 #> [50] 5686986 563626

    Но как мы узнали, что использовать населения ? Ранее, применяя функцию str к объекту kill , мы раскрывали имена для каждой из пяти переменных, хранящихся в этой таблице.Мы можем быстро получить доступ к именам переменных, используя:

      имен (убийств)
    #> [1] "штат" "абб." "Регион" "население" "всего"  

    Важно знать, что порядок записей в строке убийств $ сохраняет порядок строк в нашей таблице данных. Позже это позволит нам манипулировать одной переменной на основе результатов другой. Например, мы сможем упорядочить названия штатов по количеству убийств.

    Совет : R поставляется с очень хорошей функцией автозаполнения, которая избавляет нас от необходимости вводить все имена.Попробуйте ввести убийств $ p , а затем нажмите клавишу tab на клавиатуре. Эта функция и многие другие полезные функции автозаполнения доступны при работе в RStudio.

    Векторы: числа, символы и логические

    Объект убийств $ - это не одно число, а несколько. Мы называем эти типы объектов векторами . Одно число технически является вектором длины 1, но обычно мы используем термин векторы для обозначения объектов с несколькими элементами.Функция длиной сообщает вам, сколько записей находится в векторе:

      поп <- убийства $ население
    длина (поп)
    #> [1] 51  

    Этот конкретный вектор - числовой , поскольку размеры населения являются числами:

      класс (поп)
    #> [1] "numeric"  

    В числовом векторе каждая запись должна быть числом.

    Для хранения символьных строк векторы также могут быть символа класса . Например, названия штатов - это символы:

      класс (состояние $ убийств)
    #> [1] "персонаж"  

    Как и в случае с числовыми векторами, все записи в векторе символов должны быть символами.

    Другой важный тип векторов - это логических векторов . Это должно быть либо ИСТИНА , либо ЛОЖЬ .

      г <- 3 == 2
    z
    #> [1] ЛОЖЬ
    класс (z)
    #> [1] "логический"  

    Здесь == - это оператор отношения, который спрашивает, равно ли 3 2. В R, если вы просто используете один = , вы фактически назначаете переменную, но если вы используете два == , вы проверяете равенство .

    Вы можете увидеть другие реляционные операторы , набрав:

    В следующих разделах вы увидите, насколько полезными могут быть реляционные операторы.

    Мы обсудим более важные особенности векторов после следующего набора упражнений.

    Advanced : математически значения в pop являются целыми числами, а в R. есть целочисленный класс. Однако по умолчанию числам присваиваются числовые классы, даже если они являются круглыми целыми числами. Например, class (1) возвращает числовое значение. Вы можете превратить их в целые числа класса с помощью функции as.integer () или добавив L следующим образом: 1L .Отметьте класс, набрав: class (1L)

    Факторы

    В наборе данных убийств мы могли бы ожидать, что регион также будет вектором символов. Однако это не так:

      класс (убийства $ регион)
    #> [1] "коэффициент"  

    Это коэффициент . Факторы полезны для хранения категориальных данных. Мы можем видеть, что есть только 4 региона, используя функцию levels :

      уровней (область $ убийств)
    #> [1] "Северо-восток" "Юг" "Север-Центр" "Запад"  

    В фоновом режиме R сохраняет эти уровней как целые числа и сохраняет карту для отслеживания меток.Это более эффективно с точки зрения памяти, чем хранение всех символов.

    Обратите внимание, что уровни имеют порядок, отличный от порядка появления в факторном объекте. По умолчанию в R уровни следуют в алфавитном порядке. Однако часто мы хотим, чтобы уровни располагались в другом порядке. Вы можете указать порядок с помощью аргумента levels при создании фактора с помощью функции factor . Например, в наборе данных об убийствах регионы упорядочены с востока на запад.Функция reorder позволяет нам изменять порядок уровней факторной переменной на основе сводки, вычисленной на числовом векторе. Мы продемонстрируем это на простом примере и увидим более сложные в части книги «Визуализация данных».

    Предположим, нам нужны уровни региона по общему количеству убийств, а не в алфавитном порядке. Если есть значения, связанные с каждым уровнем, мы можем использовать переупорядочение и указать сводку данных для определения порядка.Следующий код берет сумму всех убийств в каждом регионе и меняет порядок множителя после этих сумм.

      регион <- убийства $ регион
    значение <- убийства $ всего
    region <- переупорядочить (регион, значение, FUN = сумма)
    уровни (регион)
    #> [1] "Северо-восток" "Север-Центр" "Запад" "Юг"  

    Новый порядок согласуется с тем фактом, что на Северо-Востоке меньше всего убийств, а на Юге больше всего.

    Предупреждение : Факторы могут быть источником путаницы, поскольку иногда они ведут себя как персонажи, а иногда нет.В результате сбивающие с толку факторы и символы являются частым источником ошибок.

    Списки

    Кадры данных являются частным случаем списков . Списки полезны, потому что вы можете хранить любую комбинацию разных типов. Вы можете создать список с помощью функции list следующим образом:

      запись <- list (name = "John Doe",
                 student_id = 1234,
                 оценки = c (95, 82, 91, 97, 93),
                 final_grade = "A")  

    Функция c описана в разделе 2.6.

    Этот список включает символ, число, вектор с пятью числами и еще один символ.

      запись
    #> $ name
    #> [1] "Джон Доу"
    #>
    #> $ student_id
    #> [1] 1234
    #>
    #> $ grades
    #> [1] 95 82 91 97 93
    #>
    #> $ final_grade
    #> [1] "А"
    класс (запись)
    #> [1] "список"  

    Как и в случае с фреймами данных, вы можете извлечь компоненты списка с помощью средства доступа $ .

      запись $ student_id
    #> [1] 1234  

    Мы также можем использовать двойные квадратные скобки ( [[) как это:

      запись [["student_id"]]
    #> [1] 1234  

    Вам следует привыкнуть к тому, что в R часто есть несколько способов сделать то же самое, например, получить доступ к записям.

    Вы также можете встретить списки без имен переменных.

      запись2 <- список ("Джон Доу", 1234)
    запись2
    #> [[1]]
    #> [1] "Джон Доу"
    #>
    #> [[2]]
    #> [1] 1234  

    Если список не имеет имен, вы не можете извлечь элементы с помощью $ , но вы все равно можете использовать метод скобок и вместо указания имени переменной вы указываете индекс списка, например:

      запись2 [[1]]
    #> [1] "Джон Доу"  

    Мы не будем использовать списки до конца, но вы можете встретить один в своем собственном исследовании R.По этой причине мы покажем вам некоторые основы здесь.

    Матрицы

    Матрицы - это еще один тип объектов, которые распространены в R. Матрицы похожи на фреймы данных в том, что они двумерны: они имеют строки и столбцы. Однако, как и числовые, символьные и логические векторы, записи в матрицах должны быть одного типа. По этой причине фреймы данных гораздо более полезны для хранения данных, поскольку в них могут быть символы, множители и числа.

    Тем не менее, у матриц есть главное преимущество перед фреймами данных: мы можем выполнять операции матричной алгебры - мощный тип математической техники.Мы не описываем эти операции в этой книге, но многое из того, что происходит в фоновом режиме, когда вы выполняете анализ данных, связано с матрицами. Мы рассмотрим матрицы более подробно в главе 33.1, но кратко опишем их здесь, поскольку некоторые функции, которые мы изучим, возвращают матрицы.

    Мы можем определить матрицу, используя функцию matrix . Нам нужно указать количество строк и столбцов.

      мат <- матрица (1:12, 4, 3)
    мат
    #> [, 1] [, 2] [, 3]
    #> [1,] 1 5 9
    #> [2,] 2 6 10
    #> [3,] 3 7 11
    #> [4,] 4 8 12  

    Вы можете получить доступ к определенным записям в матрице, используя квадратные скобки ( [).Если вам нужна вторая строка, третий столбец, используйте:

    Если вам нужна вся вторая строка, оставьте место столбца пустым:

    Обратите внимание, что это возвращает вектор, а не матрицу.

    Аналогично, если вам нужен весь третий столбец, оставьте место строки пустым:

      мат [, 3]
    #> [1] 9 10 11 12  

    Это тоже вектор, а не матрица.

    При желании вы можете получить доступ к более чем одному столбцу или более чем одной строке. Это даст вам новую матрицу.

      мат [, 2: 3]
    #> [, 1] [, 2]
    #> [1,] 5 9
    #> [2,] 6 10
    #> [3,] 7 11
    #> [4,] 8 12  

    Вы можете подмножество строк и столбцов:

      мат [1: 2, 2: 3]
    #> [, 1] [, 2]
    #> [1,] 5 9
    #> [2,] 6 10  

    Мы можем преобразовать матрицы в кадры данных с помощью функции as.data.frame :

      as.data.frame (мат)
    #> V1 V2 V3
    #> 1 1 5 9
    #> 2 2 6 10
    #> 3 3 7 11
    #> 4 4 8 12  

    Вы также можете использовать одиночные квадратные скобки ( [) для доступа к строкам и столбцам фрейма данных:

      данных («убийства»)
    убийства [25, 1]
    #> [1] "Миссисипи"
    убийства [2: 3,]
    #> штат абб область население всего
    #> 2 Аляска АК Запад 710231 19
    #> 3 Аризона, Аризона, Запад 63 232  

    Упражнения

    1.Загрузите набор данных об убийствах в США.

      библиотека (dslabs)
    данные (убийства)  

    Используйте функцию str , чтобы изучить структуру объекта убийств . Что из следующего лучше всего описывает переменные, представленные в этом фрейме данных?

    1. 51 штат.
    2. Количество убийств во всех 50 штатах и ​​округе Колумбия.
    3. Название штата, аббревиатура названия штата, регион штата, численность населения штата и общее количество убийств за 2010 год.
    4. str не содержит релевантной информации.

    2. Какие имена столбцов используются во фрейме данных для этих пяти переменных?

    3. Используйте средство доступа $ , чтобы извлечь аббревиатуры состояний и назначить их объекту и . Какой класс у этого объекта?

    4. Теперь используйте квадратные скобки, чтобы извлечь аббревиатуры состояний и назначить их объекту b . Используйте функцию идентичный , чтобы определить, являются ли a и b одинаковыми.

    5. Мы видели, что в столбце региона хранится коэффициент. Вы можете подтвердить это, набрав:

    В одной строке кода используйте функцию , уровни и длину , чтобы определить количество регионов, определенных этим набором данных.

    6. Функция table принимает вектор и возвращает частоту каждого элемента. Вы можете быстро увидеть, сколько состояний находится в каждом регионе, применив эту функцию. Используйте эту функцию в одной строке кода, чтобы создать таблицу состояний для каждого региона.

    Векторы

    В R самыми основными объектами, доступными для хранения данных, являются векторов . Как мы видели, сложные наборы данных обычно можно разбить на компоненты, которые являются векторами. Например, во фрейме данных каждый столбец является вектором. Здесь мы узнаем больше об этом важном классе.

    Создание векторов

    Мы можем создавать векторы, используя функцию c , что означает concatenate . Мы используем c для объединения записей следующим образом:

      коды <- c (380, 124, 818)
    коды
    #> [1] 380 124 818  

    Мы также можем создавать векторы символов.Мы используем кавычки, чтобы обозначить, что записи являются символами, а не именами переменных.

      страна <- c («италия», «канада», «египет»)  

    В R вы также можете использовать одинарные кавычки:

      страна <- c ('италия', 'канада', 'египет)  

    Но будьте осторожны, чтобы не путать одинарную кавычку 'с обратной кавычкой '.

    К настоящему времени вы должны знать, что если наберете:

      страна <- c (италия, канада, египет)  

    вы получаете сообщение об ошибке, потому что переменные italy , canada и egypt не определены.Если мы не используем кавычки, R ищет переменные с этими именами и возвращает ошибку.

    Имена

    Иногда полезно давать имена элементам вектора. Например, при определении вектора кодов стран мы можем использовать имена для соединения двух:

     коды  <- c (италия = 380, канада = 124, египет = 818)
    коды
    #> италия канада египет
    #> 380 124818  

    Объект с кодами продолжает быть числовым вектором:

      класс (коды)
    #> [1] "numeric"  

    , но с именами:

      наименований (кодов)
    #> [1] "италия" "канада" "египет"  

    Если использование строк без кавычек выглядит запутанным, знайте, что вы также можете использовать кавычки:

     коды  <- c ("italy" = 380, "canada" = 124, "egypt" = 818)
    коды
    #> италия канада египет
    #> 380 124818  

    Нет разницы между вызовом этой функции и предыдущим.Это один из многих отличий R от других языков.

    Мы также можем назначать имена, используя имена функции:

      коды <- c (380, 124, 818)
    страна <- c ("италия", "канада", "египет")
    имена (коды) <- страна
    коды
    #> италия канада египет
    #> 380 124818  

    Последовательности

    Еще одна полезная функция для создания векторов генерирует последовательности:

      сек (1, 10)
    #> [1] 1 2 3 4 5 6 7 8 9 10  

    Первый аргумент определяет начало, а второй - конец, который включается.По умолчанию увеличивается с шагом 1, но третий аргумент позволяет нам сказать, на сколько прыгнуть:

      сек (1, 10, 2)
    #> [1] 1 3 5 7 9  

    Если нам нужны последовательные целые числа, мы можем использовать следующее сокращение:

      1:10
    #> [1] 1 2 3 4 5 6 7 8 9 10  

    Когда мы используем эти функции, R производит целые числа, а не числа, потому что они обычно используются для индексации чего-либо:

      класс (1:10)
    #> [1] "целое число"  

    Однако, если мы создадим последовательность, включающую нецелые числа, класс изменится:

      класс (seq (1, 10, 0.5))
    #> [1] "numeric"  

    Подгруппа

    Мы используем квадратные скобки для доступа к определенным элементам вектора. Для вектора с кодами , которые мы определили выше, мы можем получить доступ ко второму элементу, используя:

      коды [2]
    #> канада
    #> 124  

    Вы можете получить более одной записи, используя вектор с несколькими записями в качестве индекса:

      коды [c (1,3)]
    #> италия египет
    #> 380 818  

    Определенные выше последовательности особенно полезны, если мы хотим получить доступ, скажем, к первым двум элементам:

      коды [1: 2]
    #> италия канада
    #> 380 124  

    Если у элементов есть имена, мы также можем получить доступ к записям, используя эти имена.Ниже приведены два примера.

     коды  ["канада"]
    #> канада
    #> 124
    коды [c ("египет", "италия")]
    #> египет италия
    #> 818 380  

    Принуждение

    В общем, приведение - это попытка R быть гибкой с типами данных. Когда запись не соответствует ожидаемой, некоторые из предварительно созданных функций R пытаются угадать, что имелось в виду, прежде чем выдают ошибку. Это тоже может привести к путанице. Неспособность понять принуждение может свести с ума программистов при попытке написать код на R, поскольку в этом отношении он ведет себя совершенно иначе, чем большинство других языков.Давайте узнаем об этом на нескольких примерах.

    Мы сказали, что все векторы должны быть одного типа. Итак, если мы попытаемся объединить, скажем, цифры и символы, вы можете ожидать ошибку:

    Но мы не получаем ни одного предупреждения, даже предупреждения! Что произошло? Посмотрите на x и его класс:

      х
    #> [1] «1» «канада» «3»
    класс (x)
    #> [1] "персонаж"  

    R преобразовал данные в символы. Он предположил, что, поскольку вы помещаете строку символов в вектор, вы имели в виду, что 1 и 3 на самом деле были строками символов «1» и « 3 ».Тот факт, что не выдается даже предупреждения, является примером того, как принуждение может вызвать множество незамеченных ошибок в R.

    .

    R также предлагает функции для перехода от одного типа к другому. Например, вы можете превратить числа в символы с помощью:

      х <- 1: 5
    y <- as.character (x)
    y
    #> [1] "1" "2" "3" "4" "5"  

    Вы можете повернуть его обратно с помощью as.numeric :

      как числовой (y)
    #> [1] 1 2 3 4 5  

    Эта функция на самом деле весьма полезна, поскольку наборы данных, содержащие числа в виде символьных строк, являются обычным явлением.

    Недоступно (NA)

    Когда функция пытается привести один тип к другому и сталкивается с невозможным случаем, она обычно выдает предупреждение и превращает запись в специальное значение, называемое NA для «недоступно». Например:

      x <- c ("1", "b", "3")
    as.numeric (x)
    #> Предупреждение: НП введены принуждением
    #> [1] 1 NA 3  

    R не догадывается, какой номер вы хотите, когда вы набираете b , поэтому он не пытается.

    Как специалист по данным, вы часто будете сталкиваться с NA , поскольку они обычно используются для пропущенных данных, что является распространенной проблемой в реальных наборах данных.

    Упражнения

    1. Используйте функцию c , чтобы создать вектор со средними высокими температурами в январе для Пекина, Лагоса, Парижа, Рио-де-Жанейро, Сан-Хуана и Торонто: 35, 88, 42, 84, 81 и 30 градусов по Фаренгейту. Назовите объект temp .

    2. Теперь создайте вектор с названиями городов и назовите объект city .

    3. Используйте функцию names и объекты, определенные в предыдущих упражнениях, чтобы связать данные температуры с соответствующим городом.

    4. Используйте операторы [ и : , чтобы получить доступ к температуре первых трех городов в списке.

    5. Используйте оператор [, чтобы получить доступ к температуре Парижа и Сан-Хуана.

    6. Используйте оператор : , чтобы создать последовательность чисел \ (12,13,14, \ точки, 73 \).

    7. Создайте вектор, содержащий все положительные нечетные числа меньше 100.

    8. Создайте вектор чисел, который начинается с 6, не проходит 55 и складывает числа с шагом 4/7: 6, 6 + 4/7, 6 + 8/7 и так далее. Сколько номеров в списке? Подсказка: используйте seq и длину .

    9. Каков класс следующего объекта a <- seq (1, 10, 0.5) ?

    10. Каков класс следующего объекта a <- seq (1, 10) ?

    11.Класс class (a <-1) является числовым, а не целым. R по умолчанию является числовым, и для принудительного использования целого числа необходимо добавить букву L . Подтвердите, что класс 1L является целым числом.

    12. Определите следующий вектор:

    и заставить его получить целые числа.

    Сортировка

    Теперь, когда мы освоили некоторые базовые знания R, давайте попробуем получить представление о безопасности различных государств в контексте убийств с применением огнестрельного оружия.

    сорт

    Допустим, мы хотим расположить штаты от наименее к числу убийств с применением огнестрельного оружия.Функция sort сортирует вектор в порядке возрастания. Таким образом, мы можем увидеть наибольшее количество убийств с применением огнестрельного оружия, набрав:

      библиотека (dslabs)
    данные (убийства)
    сортировка (убийств всего $)
    #> [1] 2 4 5 5 7 8 11 12 12 16 19 21 22
    #> [14] 27 32 36 38 53 63 65 67 84 93 93 97 97
    #> [27] 99 111 116 118 120 135 142 207 219 232 246250 286
    #> [40] 293 310 321 351 364 376 413 457 517 669 805 1257  

    Однако это не дает нам информации о том, в каких штатах указано количество убийств.Например, мы не знаем, в каком штате было 1257.

    заказ

    Функция порядок ближе к тому, что мы хотим. Он принимает вектор в качестве входных данных и возвращает вектор индексов, которые сортируют входной вектор. Это может показаться запутанным, поэтому давайте рассмотрим простой пример. Мы можем создать вектор и отсортировать его:

      х <- с (31, 4, 15, 92, 65)
    sort (x)
    #> [1] 4 15 31 65 92  

    Вместо сортировки входного вектора функция order возвращает индекс, который сортирует входной вектор:

      индекс <- заказ (x)
    x [индекс]
    #> [1] 4 15 31 65 92  

    Это тот же результат, что и возвращаемый функцией sort (x) .Если мы посмотрим на этот индекс, мы увидим, почему он работает:

      х
    #> [1] 31 4 15 92 65
    заказ (x)
    #> [1] 2 3 1 5 4  

    Вторая запись x является наименьшей, поэтому порядок (x) начинается с 2 . Следующая наименьшая - это третья запись, поэтому вторая запись - 3 и так далее.

    Как это помогает нам упорядочивать штаты убийствами? Во-первых, помните, что записи векторов, к которым вы обращаетесь с $ , следуют в том же порядке, что и строки в таблице.Например, эти два вектора, содержащие названия состояний и аббревиатуры, соответственно, соответствуют их порядку:

      убийств $ state [1: 6]
    #> [1] «Алабама» «Аляска» «Аризона» «Арканзас» «Калифорния»
    #> [6] "Колорадо"
    убивает $ abb [1: 6]
    #> [1] "AL" "AK" "AZ" "AR" "CA" "CO"  

    Это означает, что мы можем упорядочить названия штатов по количеству их убийств. Сначала мы получаем индекс, который упорядочивает векторы согласно общему количеству убийств, а затем индексируем вектор названий штатов:

      ind <- заказ (всего $ убийств)
    убивает $ abb [ind]
    #> [1] "VT" "ND" "NH" "WY" "HI" "SD" "ME" "ID" "MT" "RI" "AK" "IA" "UT"
    #> [14] "WV" "NE" "OR" "DE" "MN" "KS" "CO" "NM" "NV" "AR" "WA" "CT" "WI"
    #> [27] "DC" "OK" "KY" "MA" "MS" "AL" "IN" "SC" "TN" "AZ" "NJ" "VA" "NC"
    #> [40] "MD" "OH" "MO" "LA" "IL" "GA" "MI" "PA" "NY" "FL" "TX" "CA"  

    Согласно вышеизложенному, в Калифорнии было больше всего убийств.

    макс и макс

    Если нас интересует только запись с наибольшим значением, мы можем использовать max для значения:

      макс (всего $ убийств)
    #> [1] 1257  

    и which.max для индекса наибольшего значения:

      i_max <- which.max (всего $ убийств)
    убивает $ state [i_max]
    #> [1] "Калифорния"  

    Для минимума мы можем использовать мин. и , что.min таким же образом.

    Означает ли это, что Калифорния - самый опасный штат? В следующем разделе мы утверждаем, что нам следует рассматривать ставки, а не итоги. Перед тем, как сделать это, мы вводим одну последнюю функцию, связанную с порядком: rank .

    рейтинг

    Хотя функция rank используется не так часто, как order и sort , она также связана с порядком и может быть полезна. Для любого заданного вектора он возвращает вектор с рангом первой записи, второй записи и т. Д.входного вектора. Вот простой пример:

      х <- с (31, 4, 15, 92, 65)
    ранг (х)
    #> [1] 3 1 2 5 4  

    Подводя итог, давайте посмотрим на результаты трех введенных нами функций:

    оригинал Сортировать порядок классифицировать
    31 год 4 2 3
    4 15 3 1
    15 31 год 1 2
    92 65 5 5
    65 92 4 4

    Остерегайтесь переработки

    Другой частый источник незамеченных ошибок в R - использование повторного использования .Мы видели, что векторы складываются поэлементно. Поэтому, если векторы не совпадают по длине, естественно предположить, что мы должны получить ошибку. Но мы этого не делаем. Обратите внимание, что происходит:

      х <- с (1,2,3)
    у <- с (10, 20, 30, 40, 50, 60, 70)
    х + у
    #> Предупреждение в x + y: более длинная длина объекта не кратна меньшей
    #> длина объекта
    #> [1] 11 22 33 41 52 63 71  

    Предупреждение появляется, но ошибки нет. Для вывода R переработал числа в формате x . Обратите внимание на последнюю цифру чисел в выводе.

    Упражнения

    Для этих упражнений мы будем использовать набор данных об убийствах в США. Убедитесь, что вы загрузили его перед запуском.

      библиотека (dslabs)
    данные («убийства»)  

    1. Используйте оператор $ для доступа к данным о численности населения и сохраните их как объект pop . Затем используйте функцию sort , чтобы переопределить pop , чтобы он был отсортирован. Наконец, используйте оператор [, чтобы сообщить о наименьшей численности населения.

    2. Теперь вместо наименьшего размера совокупности найдите индекс записи с наименьшим размером совокупности. Подсказка: используйте order вместо sort .

    3. Фактически мы можем выполнить ту же операцию, что и в предыдущем упражнении, используя функцию which.min . Напишите одну строку кода, которая сделает это.

    4. Теперь мы знаем, насколько маленьким является наименьшее состояние, и какая строка представляет его. Какой это штат? Определите переменную состояния как имена состояний из фрейма данных убийств .Сообщите название штата с наименьшим населением.

    5. Вы можете создать фрейм данных с помощью функции data.frame . Вот быстрый пример:

      темп <- c (35, 88, 42, 84, 81, 30)
    city ​​<- c («Пекин», «Лагос», «Париж», «Рио-де-Жанейро»,
              «Сан-Хуан», «Торонто»)
    city_temps <- data.frame (name = city, temperature = temp)  

    Используйте функцию rank для определения ранга населения каждого штата от наименьшего до наибольшего.Сохраните эти ранги в объекте с именем ranks , затем создайте фрейм данных с именем состояния и его рангом. Назовите фрейм данных my_df .

    6. Повторите предыдущее упражнение, но на этот раз закажите my_df так, чтобы состояния были упорядочены от наименее населенных к наиболее многонаселенным. Подсказка: создайте объект ind , который хранит индексы, необходимые для упорядочивания значений генеральной совокупности. Затем используйте оператор квадратных скобок [, чтобы изменить порядок каждого столбца во фрейме данных.

    7. Вектор na_example представляет собой серию отсчетов. Быстро осмотреть объект можно с помощью:

      данные ("na_example")
    str (na_example)
    #> int [1: 1000] 2 1 3 2 1 3 1 4 3 2 ...  

    Однако, когда мы вычисляем среднее значение с помощью функции mean , мы получаем NA :

      среднее (na_example)
    #> [1] NA  

    Функция is.na возвращает логический вектор, который сообщает нам, какие записи являются NA .Назначьте этот логический вектор объекту с именем ind и определите, сколько NA s имеет na_example .

    8. Теперь снова вычислите среднее значение, но только для записей, отличных от NA . Подсказка: помните ! оператор.

    Векторная арифметика

    В Калифорнии было больше всего убийств, но означает ли это, что это самый опасный штат? Что, если в нем намного больше людей, чем в любом другом штате? Мы можем быстро подтвердить, что в Калифорнии действительно самое большое население:

    человек.
      библиотека (dslabs)
    данные («убийства»)
    убивает $ state [который.макс (убивает население $)]
    #> [1] "Калифорния"  

    с населением более 37 миллионов человек. Поэтому несправедливо сравнивать итоги, если мы заинтересованы в том, чтобы узнать, насколько безопасно это государство. Что нам действительно нужно вычислять, так это количество убийств на душу населения. В отчетах, которые мы описываем в разделе «Мотивация», в качестве единицы измерения использовались убийства на 100 000 человек. Чтобы вычислить это количество, пригодятся мощные возможности векторной арифметики R.

    Изменение масштаба вектора

    В R арифметические операции над векторами выполняются поэлементно .Для быстрого примера предположим, что у нас есть высота в дюймах:

    .
      дюймов <- c (69, 62, 66, 70, 70, 73, 67, 73, 67, 70)  

    и хотите преобразовать в сантиметры. Обратите внимание, что происходит, когда мы умножаем дюймов на 2,54:

      дюймов * 2,54
    #> [1] 175 157 168 178 178 185 170 185 170 178  

    В строке выше мы умножили каждый элемент на 2,54. Точно так же, если для каждой записи мы хотим вычислить, на сколько дюймов выше или меньше 69 дюймов, средний рост мужчин, мы можем вычесть это из каждой записи следующим образом:

      дюймов - 69
    #> [1] 0-7-3 1 1 4-2 4-2 1  

    Два вектора

    Если у нас есть два вектора одинаковой длины, и мы суммируем их в R, они будут добавляться запись за записью следующим образом:

    \ [ \ begin {pmatrix} а \\ б \\ с \\ d \ end {pmatrix} + \ begin {pmatrix} е \\ f \\ грамм\\ час \ end {pmatrix} знак равно \ begin {pmatrix} а + е \\ б + е \\ с + г \\ д + ч \ end {pmatrix} \]

    То же самое верно и для других математических операций, таких как - , * и /.

    Это означает, что для вычисления количества убийств мы можем просто ввести:

      murder_rate <- убийств $ всего / убийств $ населения * 100000  

    Как только мы это сделаем, мы заметим, что Калифорния больше не находится в верхней части списка. Фактически, мы можем использовать то, что мы узнали, чтобы упорядочить штаты по количеству убийств:

      убийств $ abb [заказ (murder_rate)]
    #> [1] "VT" "NH" "HI" "ND" "IA" "ID" "UT" "ME" "WY" "OR" "SD" "MN" "MT"
    #> [14] "CO" "WA" "WV" "RI" "WI" "NE" "MA" "IN" "KS" "NY" "KY" "AK" "OH"
    #> [27] "CT" "NJ" "AL" "IL" "OK" "NC" "NV" "VA" "AR" "TX" "NM" "CA" "FL"
    #> [40] "TN" "PA" "AZ" "GA" "MS" "MI" "DE" "SC" "MD" "MO" "LA" "DC"  

    Упражнения

    1.2/6 \).

    3. Вычислите коэффициент убийств на 100 000 для каждого штата и сохраните его в объекте murder_rate . Затем вычислите средний уровень убийств в США, используя функцию , среднее значение . Что в среднем?

    Индексирование

    R предоставляет мощный и удобный способ индексирования векторов. Мы можем, например, выделить вектор на основе свойств другого вектора. В этом разделе мы продолжаем работать с нашим примером убийств в США, который мы можем загрузить следующим образом:

      библиотека (dslabs)
    данные («убийства»)  

    Подмножество с логическими элементами

    Теперь мы рассчитали уровень убийств, используя:

      murder_rate <- убийств $ всего / убийств $ населения * 100000  

    Представьте, что вы переезжаете из Италии, где, согласно новостному сообщению ABC, количество убийств составляет всего 0.71 на 100 000. Вы бы предпочли переехать в штат с аналогичным уровнем убийств. Еще одна мощная особенность R - то, что мы можем использовать логику для индексации векторов. Если мы сравниваем вектор с одним числом, он фактически выполняет проверку для каждой записи. Ниже приведен пример, связанный с вопросом выше:

      инд <- скорость_убийств <0,71  

    Если вместо этого мы хотим узнать, меньше или равно значение, мы можем использовать:

      инд <- скорость_убийств <= 0,71  

    Обратите внимание, что мы возвращаем логический вектор с ИСТИНА для каждой записи, меньшей или равной 0.71. Чтобы увидеть, какие это состояния, мы можем использовать тот факт, что векторы можно индексировать с помощью логики.

      убийств $ state [ind]
    #> [1] "Гавайи" "Айова" "Нью-Гэмпшир" "Северная Дакота"
    #> [5] "Вермонт"  

    Чтобы подсчитать, сколько из них ИСТИНА, функция sum возвращает сумму элементов вектора, и логические векторы получают , приведенный к к числовому, с ИСТИНА, кодируется как 1 и ЛОЖЬ как 0. Таким образом, мы можем подсчитайте состояния, используя:

    Логические операторы

    Предположим, нам нравятся горы, и мы хотим переехать в безопасное государство в западном регионе страны.Мы хотим, чтобы количество убийств было не больше 1. В этом случае мы хотим, чтобы были правдой две разные вещи. Здесь мы можем использовать логические операторы и , которые в R представлены как и . Эта операция приводит к ИСТИНА только тогда, когда оба логических значения ИСТИНА . Чтобы убедиться в этом, рассмотрим следующий пример:

      ИСТИНА И ИСТИНА
    #> [1] ИСТИНА
    ИСТИНА И ЛОЖЬ
    #> [1] ЛОЖЬ
    ЛОЖЬ И ЛОЖЬ
    #> [1] ЛОЖЬ  

    В нашем примере мы можем сформировать две логические схемы:

      запад <- убийства $ region == "Запад"
    безопасный <- murder_rate <= 1  

    , и мы можем использовать и , чтобы получить вектор логических значений, который сообщает нам, какие состояния удовлетворяют обоим условиям:

      ind <- сейф и запад
    убийства $ state [ind]
    #> [1] «Гавайи» «Айдахо» «Орегон» «Юта» «Вайоминг»  

    который

    Предположим, мы хотим узнать количество убийств в Калифорнии.Для этого типа операций удобно преобразовывать векторы логических чисел в индексы вместо того, чтобы хранить длинные векторы логических чисел. Функция , которая сообщает нам, какие элементы логического вектора являются ИСТИННЫМИ. Итак, мы можем ввести:

      ind <- который (убивает $ state == "Калифорния")
    murder_rate [ind]
    #> [1] 3.37  

    совпадение

    Если вместо одного штата мы хотим узнать количество убийств для нескольких штатов, например, Нью-Йорка, Флориды и Техаса, мы можем использовать функцию соответствует .Эта функция сообщает нам, какие индексы второго вектора соответствуют каждой из записей первого вектора:

      ind <- match (c («Нью-Йорк», «Флорида», «Техас»), $ state)
    инд
    #> [1] 33 10 44  

    Теперь мы можем посмотреть на количество убийств:

      процент убийств [ind]
    #> [1] 2,67 3,40 3,20  

    % в%

    Если вместо индекса нам нужна логика, которая сообщает нам, находится ли каждый элемент первого вектора во втором, мы можем использовать функцию % в% .Представим, что вы не уверены, являются ли Бостон, Дакота и Вашингтон штатами. Узнать можно так:

      c («Бостон», «Дакота», «Вашингтон»)% в% убийств $ штат
    #> [1] FALSE FALSE TRUE  

    Обратите внимание, что мы будем часто использовать % в% на протяжении всей книги.

    Advanced : существует связь между match и % в% от до , который . Чтобы увидеть это, обратите внимание, что следующие две строки производят один и тот же индекс (хотя и в разном порядке):

     совпадение  (c («Нью-Йорк», «Флорида», «Техас»), штат $ убийств)
    #> [1] 33 10 44
    который (убивает $ state% в% c ("Нью-Йорк", "Флорида", "Техас"))
    #> [1] 10 33 44  

    Упражнения

    Начните с загрузки библиотеки и данных.

      библиотека (dslabs)
    данные (убийства)  

    1. Вычислите коэффициент убийств на 100 000 для каждого штата и сохраните его в объекте с именем murder_rate . Затем используйте логические операторы для создания логического вектора с именем low , который сообщает нам, какие записи murder_rate ниже 1.

    2. Теперь используйте результаты предыдущего упражнения и функцию which для определения индексов murder_rate , связанных со значениями ниже 1.

    3. Используйте результаты предыдущего упражнения, чтобы сообщить названия штатов, в которых уровень убийств ниже 1.

    4. Теперь расширите код из упражнений 2 и 3, чтобы сообщить о штатах на северо-востоке с уровнем убийств ниже 1. Подсказка: используйте ранее определенный логический вектор low и логический оператор & .

    5. В предыдущем упражнении мы вычислили уровень убийств для каждого штата и среднее значение этих чисел. Сколько штатов ниже среднего?

    6.Используйте функцию сопоставления, чтобы идентифицировать состояния с помощью сокращений AK, MI и IA. Подсказка: начните с определения индекса записей убийств $ abb , которые соответствуют трем аббревиатурам, затем используйте оператор [ для извлечения состояний.

    7. Используйте оператор % в% , чтобы создать логический вектор, который отвечает на вопрос: какие из следующих сокращений являются действительными: MA, ME, MI, MO, MU?

    8. Расширьте код, который вы использовали в упражнении 7, чтобы сообщить об одной записи, которая представляет собой , а не , как фактическое сокращение.Подсказка: используйте ! Оператор , который превращает FALSE в TRUE и наоборот, затем который для получения индекса.

    Земельные участки

    В главе 7 мы описываем дополнительный пакет, который обеспечивает мощный подход к созданию графиков в R. Затем у нас есть целая часть по визуализации данных, в которой мы приводим множество примеров. Здесь мы кратко опишем некоторые функции, доступные в базовой установке R.

    участок

    График Функция может использоваться для построения диаграмм рассеяния.6 y <- убийств $ всего участок (x, y)

    Для быстрого построения графика без двойного доступа к переменным мы можем использовать с функцией :

      с (убийства, заговор (население, всего))  

    Функция с позволяет нам использовать имена столбцов kill в функции plot . 6 total_gun_murders <- убийств $ всего участок (население_в_миллионах, общее_пушечное_ убийство)

    Имейте в виду, что во многих штатах население составляет менее 5 миллионов человек, и они являются скученными.Мы можем получить больше информации, сделав этот график в логарифмической шкале. Преобразуйте переменные, используя преобразование log10 , а затем постройте их.

    2. Создайте гистограмму населения штата.

    3. Создайте диаграммы населения штата по регионам.

    Строка

    - Ссылка Arduino

    Описание

    Текстовые строки могут быть представлены двумя способами. вы можете использовать тип данных String, который является частью ядра начиная с версии 0019, или вы можете создать строку из массива типа char и завершить ее нулем.На этой странице описан последний метод. Дополнительные сведения об объекте String, который дает вам больше функциональных возможностей за счет большего объема памяти, см. На странице объекта String.

    Синтаксис

    Все следующие допустимые объявления для строк.

    char Str1 [15];
    char Str2 [8] = {'a', 'r', 'd', 'u', 'i', 'n', 'o'};
    char Str3 [8] = {'а', 'r', 'd', 'u', 'i', 'n', 'o', '\ 0'};
    char Str4 [] = "arduino";
    char Str5 [8] = "arduino";
    char Str6 [15] = "arduino";

    Возможности объявления строк

    • Объявить массив символов без его инициализации, как в Str1

    • Объявите массив символов (с одним дополнительным символом), и компилятор добавит требуемый нулевой символ, как в Str2

    • Явно добавьте нулевой символ, Str3

    • Инициализировать строковую константу в кавычках; компилятор изменит размер массива, чтобы он соответствовал строковой константе и завершающему нулевому символу, Str4

    • Инициализировать массив с явным размером и строковой константой, Str5

    • Инициализировать массив, оставив дополнительное место для строки большего размера, Str6

    Обычно строки заканчиваются нулевым символом (код ASCII 0).Это позволяет функциям (например, Serial.print () ) определять, где находится конец строки. В противном случае они продолжили бы чтение последующих байтов памяти, которые на самом деле не являются частью строки.

    Это означает, что в вашей строке должно быть место для одного символа больше, чем текст, который вы хотите, чтобы он содержал. Вот почему Str2 и Str5 должны состоять из восьми символов, хотя «arduino» всего семь - последняя позиция автоматически заполняется нулевым символом. Str4 автоматически будет иметь размер до восьми символов, один для дополнительного нуля.В Str3 мы сами явно включили нулевой символ (записанный '\ 0').

    Обратите внимание, что можно иметь строку без последнего нулевого символа (например, если вы указали длину Str2 как семь вместо восьми). Это нарушит работу большинства функций, использующих строки, поэтому не следует делать это намеренно. Однако если вы заметили, что что-то ведет себя странно (работает с символами, не входящими в строку), это может быть проблемой.

    Одиночные кавычки или двойные кавычки?

    Строки всегда определяются в двойных кавычках («Abc»), а символы всегда определяются в одинарных кавычках («A»).

    Вы можете обернуть длинные строки следующим образом:

      char myString [] = "Это первая строка"
    "это вторая строка"
    "и так далее";  

    При работе с большими объемами текста, например в проекте с ЖК-дисплеем, часто бывает удобно настроить массив строк. Поскольку сами строки являются массивами, это фактически пример двумерного массива.

    В приведенном ниже коде звездочка после типа данных char «char *» указывает, что это массив «указателей».Все имена массивов на самом деле являются указателями, поэтому это необходимо для создания массива массивов. Указатели - одна из наиболее сложных частей C ++ для понимания новичками, но не обязательно разбираться в указателях в деталях, чтобы эффективно использовать их здесь.

    Обработка текста - строки в JavaScript - Изучите веб-разработку

    Далее мы обратим наше внимание на строки - так в программировании называются фрагменты текста. В этой статье мы рассмотрим все общие вещи, которые вам действительно следует знать о строках при изучении JavaScript, такие как создание строк, экранирование строк в кавычках и объединение строк.

    Предварительные требования: Базовая компьютерная грамотность, базовое понимание HTML и CSS, понимание того, что такое JavaScript.
    Цель: Чтобы познакомиться с основами строк в JavaScript.

    Слова очень важны для людей - они составляют большую часть того, как мы общаемся. Поскольку Интернет - это в основном текстовая среда, предназначенная для того, чтобы люди могли общаться и обмениваться информацией, для нас полезно иметь контроль над словами, которые появляются в ней.HTML обеспечивает структуру и смысл нашего текста, CSS позволяет нам точно стилизовать его, а JavaScript содержит ряд функций для управления строками, создания пользовательских приветственных сообщений и подсказок, отображения правильных текстовых меток при необходимости, сортировки терминов в желаемом порядке, и многое другое.

    Практически все программы, которые мы показывали вам до сих пор в курсе, включают некоторые манипуляции со строками.

    На первый взгляд со строками работают так же, как с числами, но если копнуть глубже, можно заметить некоторые заметные различия.Начнем с того, что введем несколько основных строк в консоль разработчика браузера, чтобы ознакомиться.

    Создание строки

    1. Для начала введите следующие строки:
        let string = 'Революция не будет транслироваться по телевидению.';
      нить;  
      Как и в случае с числами, мы объявляем переменную, инициализируем ее строковым значением, а затем возвращаем значение. Единственная разница здесь в том, что при написании строки вам нужно заключить значение в кавычки.
    2. Если вы этого не сделаете или пропустите одну из кавычек, вы получите сообщение об ошибке. Попробуйте ввести следующие строки:
        let badString1 = Это тест;
      let badString2 = 'Это тест;
      let badString3 = Это тест ';  
      Эти строки не работают, потому что любой текст без кавычек считается именем переменной, именем свойства, зарезервированным словом и т. Д. Если браузер не может его найти, возникает ошибка (например, «отсутствует; перед оператором»). Если браузер видит, где начинается строка, но не может найти конец строки, как указано во второй кавычке, он выдает сообщение об ошибке (с «незавершенным строковым литералом»).Если ваша программа выдает такие ошибки, вернитесь и проверьте все свои строки, чтобы убедиться, что у вас нет пропущенных кавычек.
    3. Следующее будет работать, если вы ранее определили переменную string - попробуйте сейчас:
        пусть badString = строка;
      badString;  
      badString теперь имеет то же значение, что и строка .

    Одиночные кавычки и двойные кавычки

    1. В JavaScript вы можете выбрать одинарные или двойные кавычки для обертывания строк.Оба следующих варианта будут работать нормально:
        let sgl = 'Одиночные кавычки.';
      let dbl = "Двойные кавычки";
      sgl;
      dbl;  
    2. Между ними очень небольшая разница, и то, что вы используете, зависит от личных предпочтений. Однако вам следует выбрать одно и придерживаться его; код с разными кавычками может сбивать с толку, особенно если вы используете две разные кавычки в одной строке! Следующее вернет ошибку:
        let badQuotes = 'Что за черт? ";  
    3. Браузер будет думать, что строка не была закрыта, потому что в строке может появиться другой тип цитаты, который вы не используете для хранения ваших строк.Например, оба варианта подходят:
        let sglDbl = 'Вы бы съели «рыбный ужин»?';
      let dblSgl = "Мне грустно.";
      sglDbl;
      dblSgl;  
    4. Однако вы не можете включить одну и ту же кавычку в строку, если она используется для их содержания. Следующее приведет к ошибке, так как это сбивает браузер с толку относительно того, где заканчивается строка:
        let bigmouth = 'Я не имею права занимать свое место ...';  
      Это очень хорошо подводит нас к нашей следующей теме.

    Экранирующие символы в строке

    Чтобы исправить нашу предыдущую строку кода проблемы, нам нужно экранировать проблемную кавычку. Экранирование символов означает, что мы что-то делаем с ними, чтобы убедиться, что они распознаются как текст, а не как часть кода. В JavaScript мы делаем это, помещая обратную косую черту непосредственно перед символом. Попробуйте это:

      let bigmouth = 'У меня нет права занять свое место ...';
    большой рот;  

    Это прекрасно работает. Таким же образом можно экранировать других персонажей, e.грамм. \ ", и, кроме того, есть несколько специальных кодов. Подробнее см. Обозначение Escape.

    1. Concatenate - это причудливое программное слово, означающее« объединение вместе ». Для объединения строк в JavaScript используется оператор плюс (+), тот же, который мы используем для сложения чисел, но в этом контексте он делает что-то другое. Давайте попробуем пример в нашей консоли.
        let one = 'Привет';
      let two = 'как дела?';
      пусть соединились = один + два;
      присоединился;  
      Результатом этого является переменная с именем , присоединившаяся к , которая содержит значение «Привет, как дела?».
    2. В последнем случае мы соединили только две строки, но вы можете присоединиться к любому количеству строк, если вы добавите + между каждой парой. Попробуй это:
        пусть кратное = один + один + один + один + два;
      несколько;  
    3. Вы также можете использовать сочетание переменных и фактических строк. Попробуй это:
        let response = one + 'Я в порядке -' + два;
      отклик;  

    Примечание : когда вы вводите в код фактическую строку, заключенную в одинарные или двойные кавычки, она называется строковым литералом .

    Конкатенация в контексте

    Давайте посмотрим, как конкатенация используется в действии - вот пример из предыдущего курса:

        
      const button = document.querySelector ('кнопка');
    
    button.onclick = function () {
      let name = prompt ('Как тебя зовут?');
      alert ('Привет' + имя + ', приятно тебя видеть!');
    }  

    Здесь мы используем функцию window.prompt () в строке 4, которая просит пользователя ответить на вопрос через всплывающее диалоговое окно, а затем сохраняет введенный текст внутри заданной переменной - в данном случае name .Затем мы используем функцию window.alert () в строке 5, чтобы отобразить другое всплывающее окно, содержащее строку, которую мы собрали из двух строковых литералов и переменной name , посредством конкатенации.

    Числа против строк

    1. Итак, что происходит, когда мы пытаемся сложить (или объединить) строку и число? Попробуем в нашей консоли:
        «Передний» + 242;
        
      Вы можете ожидать, что это вернет ошибку, но все работает нормально. Попытка представить строку в виде числа на самом деле не имеет смысла, но представление числа в виде строки имеет смысл, поэтому браузер довольно ловко преобразует число в строку и объединяет две строки.
    2. Вы можете сделать это даже с двумя числами - вы можете заставить число превратиться в строку, заключив его в кавычки. Попробуйте следующее (мы используем оператор typeof , чтобы проверить, является ли переменная числом или строкой):
        пусть myDate = '19' + '67';
      typeof myDate;  
    3. Если у вас есть числовая переменная, которую вы хотите преобразовать в строку, но не изменять иным образом, или строковую переменную, которую вы хотите преобразовать в число, но не изменять в противном случае, вы можете использовать следующие две конструкции:
      • Объект Number преобразует все, что ему передано, в число, если это возможно.Попробуйте следующее:
          пусть myString = '123';
        пусть myNum = Число (myString);
        typeof myNum;  
      • И наоборот, у каждого числа есть метод toString () , который преобразует его в эквивалентную строку. Попробуй это:
          пусть myNum2 = 123;
        пусть myString2 = myNum2.toString ();
        typeof myString2;  
      Эти конструкции могут быть действительно полезны в некоторых ситуациях. Например, если пользователь вводит число в текстовое поле формы, это строка.Однако, если вы хотите добавить это число к чему-либо, вам нужно, чтобы это было число, поэтому вы можете передать его через Number () , чтобы справиться с этим. Мы сделали именно это в нашей игре по угадыванию чисел, в строке 54.

    Другой тип строкового синтаксиса, с которым вы можете столкнуться, - это литералы шаблона (иногда называемые строками шаблона). Это новый синтаксис, обеспечивающий более гибкие и удобные для чтения строки.

    Примечание : Попробуйте ввести приведенные ниже примеры в консоль JavaScript вашего браузера, чтобы увидеть, какие результаты вы получите.

    Чтобы превратить стандартный строковый литерал в шаблонный литерал, необходимо заменить кавычки ( '' или '' ) на символы обратной кавычки ( `` ). Итак, на простом примере:

      let song = «Сражайся с молодежью»;  

    Превратится в шаблонный литерал, например:

      песня = `Fight the Youth`;  

    Если мы хотим объединить строки или включить в них результаты выражений, писать традиционные строки может быть неудобно:

      пусть оценка = 9;
    пусть highScore = 10;
    let output = 'Мне нравится песня "' + song + '".Я дал ему оценку «+ (оценка / высшая оценка * 100) +»;  

    Шаблонные литералы значительно упрощают это:

      output = `Мне нравится песня" $ {song} ". Я дал ему оценку $ {score / highScore * 100}%. `;  

    Больше нет необходимости открывать и закрывать несколько струнных частей - всю партию можно просто обернуть одной парой обратных кавычек. Если вы хотите включить переменную или выражение внутри строки, вы включаете его в конструкцию $ {} , которая называется заполнителем .

    Внутри шаблонных литералов можно включать сложные выражения, например:

      пусть excScore = 45;
    пусть excHighestScore = 70;
    excReport = `Вы набрали $ {excScore} / $ {excHighestScore} ($ {Math.round ((excScore / excHighestScore * 100))}%). $ {examScore> = 49? "Молодец, вы прошли!" : «Не повезло, на этот раз ты не прошел». } `;  
    • Первые два заполнителя здесь довольно просты, они включают в строку только простое значение.
    • Третий вычисляет результат в процентах и ​​округляет его до ближайшего целого числа.
    • Четвертый метод включает в себя использование тернарного оператора для проверки того, выше ли оценка определенной отметки, и печати сообщения о прохождении или неудаче в зависимости от результата.

    Еще одно замечание: если вы хотите разделить традиционную строку на несколько строк, вам нужно включить символ новой строки, \ n :

      output = 'Мне нравится песня "' + song + '". \ NЯ поставил ей оценку' + (score / highScore * 100) + '%.';  

    Литералы шаблона учитывают разрывы строк в исходном коде, поэтому символы новой строки больше не нужны.Это даст тот же результат:

      output = `Мне нравится песня" $ {song} ".
    Я дал ему оценку $ {score / highScore * 100}%. `;  

    Мы рекомендуем вам как можно скорее привыкнуть к использованию шаблонных литералов. Они хорошо поддерживаются современными браузерами, и единственное место, где вы обнаружите отсутствие поддержки, - это Internet Explorer. Во многих наших примерах по-прежнему используются стандартные строковые литералы, но в будущем мы включим больше шаблонных литералов.