selfrag-zh_baichuan2_7b_chat
Обучается на Baichuan2-7B-Chat с выборкой данных belle sft, сопровождаемых чередованием отрывков из жвики. Токены отражения соответствуют исходной версии...
Обучается на Baichuan2-7B-Chat с выборкой данных belle sft, сопровождаемых чередованием отрывков из жвики. Токены отражения соответствуют исходной версии...
— Название: BiMediX — Версия: 1.0 — Тип: Двуязычная медицинская смесь экспертов, большая языковая модель (LLM) — Языки:...
— Название: BiMediX — Версия: 1.0 — Тип: Большая языковая модель двуязычной медицинской смеси экспертов (LLM) — Языки:...
Если вы хотите добавить какое-либо конкретное квантование, не стесняйтесь спрашивать. Для создания этой модели использовалась следующая конфигурация YAML:...
.custom-table { макет таблицы: исправлено; ширина: 100%; граница-коллапс: коллапс; маржа-верх: 2em; } .custom-table td { ширина: 50%; вертикальное...
 NeuralMaxime-7B-slerp представляет собой объединение следующих моделей с использованием LazyMergekit: mlabonne/AlphaMonarch-7B mlabonne/NeuralMonarch-7B Модальности:Генерация текста Области применения:Диалог /...
Я предлагаю использовать ChatML (используйте любую системную подсказку, которая вам нравится, это всего лишь пример!): Q4KS GGUF: https://huggingface.co/Yuma42/KangalKhan-RawRuby-7B-GGUF...
Кванты матрицы важности (imatrix) GGUF для https://huggingface.co/152334H/miqu-1-70b-sf. Матрица важности была обучена для 100 тыс. токенов (200 пакетов по...
GenerRNA — это генеративная предварительно обученная языковая модель для проектирования последовательностей РНК de novo. Это модель Transformer (только...
Это мой новый любимый 7B, созданный из слияния мелодий и слияний, которые я соединил за последнюю неделю или...
Обработал все модели лазером, затем снова объединил. Надеюсь, это улучшение моей исходной модели. Конфиг выглядит так… (подробная версия...
https://huggingface.co/Sao10K/Fimbulvetr-11B-v2-Test-14-GGUF Обновлены некоторые материалы, пробуем новые. Формат подсказки об успешном эксперименте: либо Альпака, либо Викунья работают нормально. Они...
Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. Подход v7 сработал лучше, чем я думал, поэтому...
«Основная» ветка содержит только файл Measure.json, загрузите одну из других веток для модели (см. ниже). Каждая ветка содержит...
Все блокноты удобны для начинающих! Добавьте свой набор данных, нажмите «Запустить все», и вы получите в 2 раза...
NeuralTrix-7B-v1 представляет собой объединение следующих моделей с использованием LazyMergekit: mlabonne/OmniBeagle-7B flemmingmiguel/MBX-7B-v3 * AiMavenAi/AiMaven-Prometheus Затем он был обучен с...
— Создатель модели: LargeWorldModel — Исходная модель: LargeWorldModel/LWM-Text-256K MaziyarPanahi/LWM-Text-256K-GGUF содержит файлы модели формата GGUF для LargeWorldModel/LWM-Text-256K. Спасибо TheBloke...
Версия инструкции Mistral 7b, настроенная на 4 бита, настроенная с использованием турецких примеров из CohereForAI/aya_dataset, не подвергавшаяся сравнительному...
Heidrun-Mistral-7B-chat — это модель чата, основанная на базе Heidrun-Mistral-7B, доработанная на датском OpenHermes и skoleGPT для формата инструкций/чата....
22.03.2024 — На сегодняшний день louisbrulenaudet/Pearl-34B-ties является «Лучшей 🤝 базовой моделью слияний и объединений около 30B» в таблице...
Доработанная (с LoRA) версия TinyLlama для новостных статей о криптовалютах для прогнозирования настроений и темы статьи. Набор данных,...
Он содержит необходимые файлы для запуска LLaVA-1.6 34B на SGLang. Вы можете запустить сервер с помощью следующей команды:...
Breeze-7B — это семейство языковых моделей, созданное на основе Mistral-7B и специально предназначенное для использования в традиционном китайском...
!image/png Спасибо @Kooten, человеку, мифу, легенде, у нас есть кванты exl2: https://huggingface.co/models?search=Kooten/Pasta-Lake-7b-exl2 Спасибо другу @bartowski за дополнительные кванты...