RTX

Комментарии еще никто не писал. Будьте первым.

Чтобы добавить комментарий войдите в систему.

Японская красавица Sakura RTX 3070 и что такое китайские видеокарты?

Привет читателю!

На ремонте самая красивая (частное мнение, выдаваемое за истину в последней инстанции) белая видеокарта:

Новый разъем питания RTX 5090

Как благодаря Мегамаркету у меня не стало RTX 4060

Сижу вечером дома, жду курьера от Мегамаркета со своим заказом. Приехал курьер, я забрал свои пакеты/коробки и благополучно ушел по своим делам. Минут через 10-15 вижу пропущенные звонки от курьера, тут он снова звонит и спрашивает - а вы уже распаковали свой заказ? Нет говорю, а хуле от меня надо что вы хотите от меня в столь поздний час? А он мне мол посылки перепутал с заказом из соседнего дома и вашим, будьте любезны проверить. Вот же думаю засада, отдал мне чужую ненужную херню вместо моей нужной херни. Ну что ж, отчего не посмотреть, но немного погодя. На том и завершился разговор. Вернулся через часик домой, вскрываю содержимое и в одном из пакетов лежит ОНА:

RTX OFF / RTX ON

Гостья из будущего – ремонтируем видеокарту Nvidia RTX 6000

Сегодняшняя героиня – Nvidia Quadro A6000. С официальной гарантией у клиента не сложилось, и эта красавица оказалась у нас.

Впечатляющие 48 гигабайт видеопамяти, по 12 двухгиговых чипов от Samsung с каждой стороны доски. Настоящий жир! Надеемся, что аппетиты игровых видеокарт не скоро дойдут до таких размеров.

Платформа видеокарты – GA102, то есть в основе лежит референсная RTX 3090, но с памятью GDDR6, а не GDDR6X. Ну и с «замечательной» системой охлаждения в виде тепловой камеры и турбины, с которой карта очень сильно греется. Поэтому ставить такую видеокарту не в серверный шкаф, а себе в компьютер – так себе идея.

Заявленный клиентом дефект – короткое замыкание.

В комплекте с карточкой идёт хитрый переходник с 2х8 pin на 1х8 pin. И он действительно хитрый, потому что запитывается видеокарта 8 pin по типу процессора. То есть это совсем другая распиновка. У клиента такого переходника не было, и он подключил видеокарту через обычный 8 pin.

В результате такого подключения 12 вольт прилетает на землю, и видеокарта уходит в защиту, что и было истолковано как КЗ.

Раз переходника нет, то покупаем новый и делаем пробный запуск.

При штатном подключении карта подняла питание, инициализировалась, но, увы, при попытке установить драйвер выпадала в код 43. Дальнейшие тесты показали ошибки по одному из каналов памяти.

Непосредственно ремонт карты заключался в реболле GPU – был отвал в левом нижнем углу из-за некачественной заводской пайки.

После реболла карта заработала в штатном режиме, подтянула драйвера и успешно прошла тесты.

Сегодня мы обошлись без межслойного восстановления дорожек и некромантии, но саму карту никак нельзя было оставить без внимания.

По вопросам ремонта можно обратиться ко мне в Телеграм — @Bisenen.
А для бесплатной помощи по любому вопросу десктопного железа — в мою группу тг.

Baldur's Gate 3 — убийца видеокарт? Ремонт Gigabyte RTX 3080 ti

Привет читателю!

В этот раз к нам на ремонт попала видеокарта RTX 3080 ti Gaming OC.

Это уже седьмая карта от компании Gigabyte за неделю с типовой проблемой по питанию.

И все они вышли из строя при прохождении Baldur's Gate 3. Такая вот игра – убийца видеокарт. Это конструктивная особенность видеокарт данного вендора, которая в совокупности с плохими заводскими термоинтерфейсами приводит к нехорошим последствиям.

Перед тем, как окончательно выйти из строя, карта во время игры несколько раз отключалась, выкручивая вертушки на 100%, пока не перестала подавать признаки жизни вовсе.

Подкидываем питание и видим нулевое потребление. Это говорит о сработавшем предохранителе, что на данной видеокарте - редкость. А, значит, 25А прошло по этому питанию :(

Вскрываем видеокарту и делаем замеры.

Диагноз — предохранитель, действительно, пробит. Также неисправен DrMOS — это заметно и внешне, и в тепловизор.

Увы, DrMOS прикипел к плате намертво и пришлось его выпиливать.

К сожалению, посадочное место тоже сильно пострадало, и посадить на него обратно "красиво" уже не выйдет. Но мы постарались.

Завершающим этапом меняем все термопрокладки, чтобы проблема не повторилась вновь. Собираем карту обратно, гоняем в тестах...

...и возвращаем счастливому владельцу, отпуск которого только начался :)

Стоимость ремонта под ключ обошлась заказчику в 10 тысяч рублей.

Для ремонта можно обратиться ко мне в Телеграм — @Bisenen.
А для бесплатной помощи по любому вопросу десктопного железа — в мою группу тг.

RTX off / RTX on

Asus ROG Strix G531, RTX 2060 и ошибка 43

Еще годный для многих игрушек ноутбук на i7-9750H и RTX2060 начал артефачить в играх, а потом и вовсе выдал ошибку 43 на видеокарте, после чего попал к нам в сервис.

АКТ 1

На приёмке выяснили, что ноутбук используется для работы и для игр и его не чистили с момента покупки. Проверяем, да RTX 2060 и да, драйвер с ошибкой 43. Оставляем на диагностику

Т.к. видеочип в системе определяется, первоначально исключаем программные проблемы (драйвера, ОС). Самое простое - подкинуть тестовый ссд с чистой системой. Разбираем, смотрим.

Видно сколько пыли в вентиляторах и можно представить сколько её в решетке радиатора. Пока нас это не интересует, отключаем родной ссд и ставим тестовый. Проверяем.

К сожалению, дефект сохранился, т.е. проблема в железе. Идём дальше.

Следующий этап - диагностический комплекс MODS, посмотреть проходит ли чип инициализацию и нет ли ошибок по видеопамяти в MATS.

Инициализация проходит успешно, а вот по памяти имеются ошибки. О чем это может говорить?

Давайте немного теории.

У чипа памяти GDDR6 имеется 180 выводов, часть из них земляные (GND или VSS), часть питание (VDD, VDDQ, VPP, VREFC), дата-линии (DQ), линии адресации и команд (CA, CABI), прочие сигналы (тактирование, reset, детект ошибок). Всё что НЕ красное, зеленое или белое - напрямую связано с видеочипом.

RTX2060 имеет 6 чипов видеопамяти и шину 192 бита, т.е. 3 канала по 64 бита (32 бита на чип памяти) и судя по полученному отчету, мы имеем сбой в канале С1, а именно, в 8 битах данных, идущих друг за другом в одной области (с 48 по 55).

Возвращаясь к вопросу выше, можно сделать несколько предположений:

  • неисправна видеопамять. Самое распространенное явление при постоянных перегревах

  • неисправен видеочип. С такими симптомами (8 сбойных бит в ряд) достаточно редкое явление, теоретически может встречаться при пробое линий EDC или DBI

  • проблемы в связи видеочип -- видеопамять. Также вероятно при обрыве линий EDC или DBI

Какое из предположений верное можно выяснить только в процессе ремонта, идя по пути от простого к сложному.

Доносим имеющуюся информацию до заказчика, согласовываем вилку цены ремонта (от замены видеопамяти до замены видеочипа). Заказчик дал добро на ремонт, но только на замену памяти, т.к. замена видеочипа показалась дороговатой затеей.

Печально, досадно, ну да ладно. Предпосылок к смерти видака вроде бы нет. Компаунд вокруг кристалла ровный, красивый (обычно если есть замыкания или обрывы по линиям со стороны чипа, на компаунде имеются мелкие трещины, либо локальные потемнения. по крайней мере по моей статистике именно так).

Приступаем к ремонту.

Первый этап: снимаем видеопамять и проверяем целостность всех линий идущих в видеочип. Оказалось, что никаких нареканий нет и можно приступать к следующему этапу: замена видеопамяти в сбойном канале на новую.

Проверяем.

MATS показал заветную зеленую надпись PASS. Значит ошибок нет и можно тестить в винде. Винда загрузилась, ошибки 43 нет, тесты крутятся.

Пара дней различных бенчей, всё прекрасно.

Ноут отправляется на выдачу ждать клиента..

При получении ноутбука проверили устранение заявленного дефекта, покрутили "бублик", дали гарантию и попрощались, но как оказалось - ненадолго.

АКТ 2

Прошло чуть больше недели, ноутбук вернулся. Начались периодические вылеты из игрушек, синие экраны и артефакты под нагрузкой.

Оставляем на диагностику и разбираемся дальше.

Всё подтверждается. Драйвера на видеочип устанавливаются без ошибок, тесты запускаются, но через какое-то время начинаются проблемы: либо вылет, либо зависание, либо синий экран (артефактов не увидел)

Тест видеопамяти из под винды через время находит ошибки, при этом MATS всегда PASS, в MODS большинство популярных тестов также проходит без ошибок

Но зациклив тестирование и увеличив количество тестов в ряд, удалось отловить ошибки по чтению и записи с указанием конкретного канала

И да, это С1, тот самый в котором производилась замена памяти. Сбойный бит также из первоначального диапазона с проблемами, что может быть совпадением, а может и не быть)

Чтобы исключить совпадение, для диагностики можно поменять друг с другом микросхемы памяти в одном канале ( C1 <=> C0). Таким образом, если проблема окажется в памяти - ошибки перейдут в другой диапазон, соответственно, если останутся на месте - будем разбираться дальше.

Сказано - сделано. Память в канале С снята, отреболена и запаяна обратно, только чипы в канале поменяны местами. Но, всё стало только хуже

Появились явные ошибки по памяти (как при первом обращении), но уже по всему каналу С (хотя не по всем битам). Ожидаемо, драйвер в ОС с ошибкой 43.

Проблему с памятью мы исключили. Повторно связь линий от памяти к видеочипу я не проверял, т.к. делал это первый раз и проблем там не было. Остается проблема с видеочипом, либо с его пайкой. Теоретически, при разрушении или частичном разрушении припоя под видеочипом (серые пятаки) могло произойти то, что произошло.

Доносим информацию до заказчика. На замену видеочипа по прежнему получаем отказ, но если реболл поможет - готов доплатить, соответственно, если нет - будем возвращать деньги за ремонт

Приступаем

Чип запаялся красиво, но результат получился отрицательный, точнее стало еще хуже.

Кроме ошибок по каналу С, появились ошибки по каналам А и B.

Следующий этап - замена видеочипа на 100% рабочий, но т.к. согласия нет - собираем ноутбук и отправляем на выдачу, с возвратом оплаченного ремонта (за минусом диагностики).

АКТ 3

Спустя чуть больше месяца в личку на авито приходит такое сообщение

Знакомая история, подумал я и уточнил последние цифры номера телефона. Оказалось - это именно тот ноутбук. Конечно, за месяц цены не изменились, но при обращении напрямую (а не через сервис) можно сделать хорошую скидку и итоговая сумма заказчика устроила.

Сразу отмечу, что договоренности по этому поводу с руководством имеются. Я работаю на своём оборудовании, сам заказываю детали, расходку, покупаю доноров и, соответственно, у меня есть свои клиенты.

Первым делом проверил, что всё в таком же состоянии как было на выдаче. Видеочип определяется, драйвер с ошибкой 43, в MATS ошибки по всем каналам.

Приступаем к замене видеочипа. Ремонт тривиальный, при наличии запчастей можно уложиться в 2-3 дня со всеми тестами.. (при отсутствии большой очереди)

Но.. я "снова потерпел фиаско". Вместо желанной зеленой надписи PASS встретила красная FAIL и в отчете еще больше сбойных битов

Видеочип точно должен быть рабочий. Питания все на месте. Страпы выставлены правильно. Посещает мысль махнуть еще раз память, но весь комплект и предварительно прозвонить ВСЕ линии идущие от памяти к видаку на ВСЕХ чипах памяти.

Память снята и на этапе замеров всё встало на свои места: имеются обрывы под ВСЕМИ чипами памяти. Где-то больше, где-то меньше. Суммарно больше 20 только с явными обрывами, также могут быть (от 5 до 30 ом, например), которые при работе на повышенной частоте будут давать паразитные наводки, соответственно, по данной линии будут ошибки

Что за обрывы и как они появились? Для наглядности образец межслойного перехода печатной платы

Для современных устройств многослойные платы по 8-10 и более слоёв уже давно являются нормой. Поэтому часть токопроводящих дорожек "ныряют" внутрь платы, идут там и "выныривают" обратно через переходные отверстия.

Лично мне встречались обрывы переходных отверстий на видеокартах (Asus, Palit, Gigabyte), и в количестве 1-2 штук на карту. Обычно причина в перегревах, механических воздействиях вкупе с изначально плохим качеством доски.

Но, это можно восстановить, при условии, что обрыв внутри переходного отверстия, а не снаружи (отрыв проводника от колодца в межслое). Исключения, конечно, есть.

Например, там где допустимо применение поверхностного монтажа (прокинуть проводник от точки А до точки Б поверх платы) или имеется явное физическое повреждение платы (как в моём предыдущем посте про ноутбук Honor)

Или вот из недавнего, где паутинка разошлась в разные стороны от места крепления платы к стойке и где конкретно перебита дорожка неизвестно, поэтому приходится снимать несколько слоёв с большой площади. Как понимаете, такое провернуть под видеочипом или памятью нереально. Внешний монтаж также недопустим, т.к. в линиях данных должны быть соблюдены длины проводников.

Возвращаемся к переходным отверстиям. Например, мы выяснили, что у нас неполный обрыв по какой-то линии. В линии 2 пятачка для припаивания BGA выводов микросхем (под памятью и под видеочипом) и 2 переходных отверстия (больше не встречал)

Соответственно, вскрываем первое отверстие (я использую набор свёрл 0.2-0.7мм, кто-то использует стоматологический инструмент для вскрытия зубных каналов), делаем замеры. Если сопротивление в норме - нам повезло и обрыв здесь, иначе - вскрываем второе и повторно делаем замеры. Если контакт появился - кидаем перемычку от колодца к дорожке, фиксируем УФ лаком. Получается как-то так

Такая процедура в среднем занимает около получаса на одну линию, при условии что видеочип и память сняты. В результате сопротивление линии должно стремиться к нулю

В случае с данным ноутбуком, где более 20 полных обрывов и имеются не полные, заниматься восстановлением доски нецелесообразно. Т.к. могут быть обрывы не в самих отверстиях, а снаружи, плюс, не факт что даже после удачного восстановления, при запайке не оборвет где-то ещё.

Донес всю информацию до заказчика и предложил такой вариант: будем менять материнскую плату. На максималках.

Под заказ была куплена материнская плата донор под такой ноутбук без видеочипа, хаба и процессора. Предварительно плату проверили на отсутствие коротких замыканий, мех. повреждений, сбитых элементов и т.п. После этого подключение к источнику питания для проверки работы входного узла, дежурных напряжений и реакция на кнопку включения. Всё успешно, далее готовим плату клиента (снимаем оставшиеся BGA - процессор и хаб)

Далее постепенно пересаживаем на плату донор клиентские детальки: сначала хаб, потом процессор, потом видеочип с видеопамятью, а также флешку основного BIOS и видео (vBIOS)

После запайки хаба проверяем что изменилось, а именно: поднимаются питания оперативной памяти, системного агента и логики ввода\вывода процессора. Система питания не поднимет напряжение на ядра процессора без его ответа, поэтому запаиваем процессор и проверяем дальше

Процессор на плате, проверка и первое включение. Всё отлично, переходим к видеочипу.

Видеочип и память запаяны, конфигурационные страпы переведены со снятого Micron на установленный Samsung, первое включение и тест MATS

Зеленая надпись PASS - успех операции. Пересадка прошла успешно, все детальки прижились.

Далее сборка и базовое тестирование. Проверка корректности установки видеодрайвера, FurMark, Heaven, Superposition

Ну и финальное, перед выдачей обслужить на правильную расходку - на систему питания и видеопамять - Laird TPutty 607, на кристаллы процессора и видеочипа - японская Shin Etsu 7921, и еще несколько кругов тестов, добавив прогоны MODS, memtest vulkan и OCCT

Ноутбук прошел все тесты и отправился к заказчику.

Подводя итог, хочется донести простой посыл: не всегда что-то кажущееся простым, является таковым. Вся видеопамять и видеочип клиента оказались живы-здоровы. Что конкретно произошло с платой сказать сложно, ваши предположения можете оставить в комментариях.

Кто дочитал - тот молодец )

Алексей, г. Казань

Все контакты тут - https://t.me/notebook116grp

У всех уже выходной и никто не берёт в ремонт Gigabyte RTX 3080ti

Читателю привет

Принесли сию карточку с типовой жалобой "нет картинки". Мол пользовались, радовались, но сломалось. Устанавливали её в другие системы, однако там ничего не запустилось тоже, пора отдавать в ремонт. По месту где-то поспрашивали, а все уже мол пьют и первомай отмечать начали заранее ,поэтому не берут. Ну и пусть пьют, а я возьму без проблем.

Карту сразу разобрал для диагностики, потому что есть возможные причины отсутствия картинки во всех системах.

А тут короткое замыкание по дополнительному питанию

Причину можно найти удобным способом, но тут не понравился припой с торца микросхемы питания

Уверен, что она и вышла из строя как раз. Буду менять на исправную

Исправная микросхема и предохранитель подготоволены и можно установить на свои места

Место под исправную микросхему подготовлено

Установлено всё за кадром уже, просто обратная последовательность пары фоток

Потребление у карты появилось, питания тоже починились, отлично

Можно собирать карту и проверять в тестах

В тестах всё отлично, никаких проблем нет, карта отремонтирована успешно

Вконтакте или телега для связи

Gigabyte rtx 3080 ti сгорела совсем?

Привет, читателю, на ремонт пришла очередная карта от гигабайт с типичным описанием неисправности - "играл в игры, радовался жизни, а она решила сгореть, причем с запахом жареного". Представили что-то подобное:

Но нет, у гигабайтов есть предохранители и были все предпосылки легкого рядового ремонта, к сожалению, не все так просто :(

Сразу же вскрываем и видим такую картину:

Внимательный читатель уже заметил какую-то проблему.

Именно так выглядят "рефабы" гигабайта. Карты, которые восстановил сам завод. Тонна термопасты, отсутствующая прокладка на видеопамяти (память работала при температуре 110° все время). Карта, при этом, была куплена как полностью новая в магазине и имела заводскую пломбу.

Ну и главная проблема:

На карте паялись две фазы питания. Одна из них, собственно, сейчас в КЗ и прикипела к плате. Согласовываем с клиентом стоимость ремонта и объясняем, что можем сделать:

А вариантов не так много. Похоже, что "ремонтную" фазу никто и не проверял. Полигона под ней банально нет и она не работала все это время. Из-за этого создаётся неравномерная нагрузка на следующую фазу которая как бы "работает за двоих".

Начинаем пилить следующую фазу, предварительно окутав пациента:

Достаточно сильно повезло. Этот дрмос будет жить. Но вот нижний, к сожалению, уже все. А это значит, что нужно научить работать шим-контроллер с меньшим количеством фаз.

Переносим сигнал pwm и делаем остальные необходимые для шимки действия, по отключению фазы.

И, наконец-то, получаем долгожданный результат :

Все фазы работают корректно и карта готова к дальнейшей работе.

Меняем все предохранители и термопрокладки на хорошие, после чего собираем карту и наконец-то её тестируем :)

Всего 78° по памяти и 65 по чипу. Прекрасные результаты, карта и дальше может радовать своего хозяина :)

Стоимость ремонта с учетом всех расходников и гарантии в 3 месяца составила 12 тысяч.

Связаться со мной можно в тг - @Bisenen или задать любой вопрос, связанный с десктопным железом в моей группе тг.

Fastler - информационно-развлекательное сообщество которое объединяет людей с различными интересами. Пользователи выкладывают свои посты и лучшие из них попадают в горячее.

Контакты

© Fastler v 2.0.2, 2024


Мы в социальных сетях: