У многих хороших программистов в школе и университете были отличные оценки по математике. Обычно эти люди могли производить многие действия в уме, не записывая их на бумаге. Те же, кто был послабее, расписывали каждый шаг. Интересно, что поощрялась именно краткость, а не подробность. Все эти сокращения производились с помощью функции кратковременной памяти.
Так почему же эта кратковременная память, так выручающая в математике, подводит в программировании? Давайте разберемся.
Как работает кратковременная память?
Почему мы вообще можем выполнять промежуточные операции в уме, не перенося их на бумагу? Ответ на этот вопрос дает когнитивная психология. В ней ту часть памяти, в которой происходят все вычисления, называют рабочей и кратковременной.
В ней все сложно и неоднозначно, и как ее не назови, ее объем весьма ограничен. В исследованиях ученых фигурируют «магические числа» пять и семь. Их принято считать средними значениями.
Объем рабочей памяти зависит от обстоятельств и интеллектуальных способностей.
Что общего у исследований, так это тот факт, что у людей с техническим складом ума объем рабочей памяти больше, чем у гуманитариев.
Благодаря кратковременной памяти мы можем не записывать промежуточные результаты, храня вычисления в ней. И чем больше у человека объем памяти, тем больше промежуточных шагов он может держать в уме.
Кратковременная память и программирование
Теперь посмотрим, как работает наша кратковременная память во время написания кода.
Выдвинем гипотезу:
Чем более объемной рабочей памятью располагает программист, тем более длинные методы и функции он пишет.
Нам требуется написать определенную часть кода, чтобы решить поставленную задачу. Задачу хочется сделать быстро, и мы удерживаем в голове все детали. Мы пишем длинные алгоритмы, которые получают исходные данные и сразу выдают готовый результат. Они объемные, ведь делают много работы. Ровно настолько, сколько данных мы удерживали в голове в момент написания кода.
И вот мы написали код, его объем в пределах пары сотен строк — это легкое и изящное решение, оно успешно работает, как вдруг через какое-то время в него придется внести косметические изменения. Хорошо, если это окажетесь вы, а если нет? Мне эта ситуация знакома. Меня часто спрашивали программисты, которые впервые видели код, как он работает. Иногда на внесение косметического изменения уходила пара дней, поскольку часть кода требовалось переписать полностью. Почему это происходило?
Дело в том, что начиная с уроков математики я привык не записывать промежуточные решения. Я записал в коде окончательное решение, и никто кроме меня не может сказать, что скрыто за это краткостью.
Но нельзя ни в коем случае сказать, что это плохо. Такие решения, одним махом решающие задачу, говорят о таланте программиста.
Но давайте попробуем подсчитать, какой объем рабочей памяти задействуется при написании кода, объемом примерно в 150 строк.
Для этого я проанализировал целый ряд функций, размещенных в Gist на Github, и подсчитал количество объектов, фигурирующих в коде с помощью грубого подсчета.
Получились такие средние значения:
- 4 аргумента функции, которые используются не менее 10 раз;
- около 30 внутренних переменных, используемых около 100 раз;
- около 10 обращений к 10 различным внешним сущностям.
Суммируя эти значения, взятые по минимуму, мы получаем 44 объекта, которые необходимо удерживать в памяти. И это без учета операций над объектами, которые тоже занимают место в памяти.
Я дополнительно просмотрел методы, которые работают с обращением к различным элементам хэшей, которые передаются в качестве аргументов функции, и обнаружил, что в таких методах присутствует около 50-ти обращений 20-ти различным элементам хэшей. Что увеличивает количество объектов в памяти до 64.
Но важно другое: мы получили 44 и 64 объекта против «магических» максимальных 7.
Можно долго спорить на тему того, что раз код работает, то значит и 44, и 64 объекта — не проблема. К тому же, рассматривались не самые длинные методы.
Значит ли это, что можно удерживать в памяти больше объектов? К тому же никто не говорит, что все объекты удерживаются в памяти единовременно.
Проблема не в удержании объектов в памяти и не в том, что метод невозможно понять. Проблема заключается в сложности понимания этого метода. Чтобы разобраться в подобном методе, нужно погрузиться в него, загрузить в свою рабочую память весь набор объектов и удерживать их там долгое время. А чем больше объектов, тем сильнее придется нагружать рабочую память, и не все могут быть способны удержать в ней от 44 до 64 объектов. Объем рабочей памяти, кроме всего прочего, зависит еще и от настроения и усталости.
Кратковременная память и метрики качества кода
Метрик, оценивающих качество кода, много. Исследования в этом направлении идут с 70-х годов.
С ними все вроде бы понятно — чем сложнее код, тем больше умственных усилий требуется для его понимания. Но есть и самый главный вопрос, связанный с метриками.
Что с этим делать? Вот измерили мы качество кода, получили цифры, значения — и что дальше?
Программирование — это сложный интеллектуальный процесс. На него влияют много факторов. Самый значимый из них, на мой взгляд — свойства и ограничения интеллекта программиста. Изучением внутреннего свойства интеллекта занимается как раз когнитивная психология.
Благодаря ей известно, что возможности интеллекта ограничены, и величину этих ограничений можно изменить. Раз возможности инструмента создания кода ограничены и измеримы, значит написанный обладателем инструмента код должен и будет иметь определенную специфику.
«Будет» — так как код является результатом работы мозга-инструмента, а «должен», поскольку код является еще и исходным материалом для создания.
Из этого следует следующая гипотеза:
Код должен отвечать определенным критериям, чтобы мозг-инструмент не «сломался» во время его обработки.
В результате у нас получается некая метрика, которую можно охарактеризовать как когнитивный вес кода. Что интересно, Холстед описал в своей книге метрику, которая очень похожа на это понятие.
Теперь мы можем ответить на вопрос о метриках кода так:
Полезные метрики кода должны быть построены таким образом, чтобы они могли показать, с каким кодом мозг будет работать легко, а с каким это будет сложно. И это будет не интуитивно, а на основе данных когнитивной науки.
Итог
Решения, описываемые «шаг за шагом» нужны не только тем, кто не может в уме удерживать большой объем данных. Это необходимо для того, чтобы при чтении и проверке решения тратилось сравнительно небольшое умственное усилие. Профессионал разберется и без промежуточных шагов, а вот новичок застрянет. Ведь сложных фрагментов кода, в которых нужно разобраться, в течение дня бывает несколько десятков.
Поэтому рефакторите свой код, чтобы в нем можно было разобраться не только профессионалам!
Это текст из личного блога, опубликованный с разрешения автора.
Этот материал – не редакционный, это – личное мнение его автора. Редакция может не разделять это мнение.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: