Help Center

Models

Bugfixes / Misc

Features

Token

Characters

veniceai

New Submission

Backlog

In Review

Planned

Up next

In Progress

Completed

Rejected

High Priority

Low Priority

New Model

Chat

History

Image

Support

Web Search

Backup / Sync

Staking Contract

Voice

Points

Settings

Code

Folders

Payment

Video

UI Design

Stickers

Merchandise

Censorship

Context Window

Social

Enhance Prompt

Plugin

File Upload

Upscale/Enhance

Edit Prompt

Language

Privacy

Venice Pro

System Prompts

Vision

LoRAs

Image Editing

Memory

Social Feed

Artifacts

Auto Mode

Blog

Incentive Fund

Agents

Model Deprecation

Credits

Library

Projects

Marketing

Here’s what Venice is working on next!

Next up

Roadmap

All completed and shipped community requested feature requests and improvements can be seen here.

Done

Shipped Features

Hey {name|there}! 👋

Hi, I'm trying out your service because it's the only service at the moment that serves Gemma 4 31b with a decent token rate (throughput).However, in many requests, it responds with 429: "The model is currently overloaded. Please try again later.". This defeats the purpose of switching to your service, because even if I implement retry logic, the overall response will take longer and it would be the same as using a slower and cheaper service.I was wondering if there's an ETA for fixing this and improving the reliability of Gemma 4 31b?Thanks,Max

Hallo, ich teste gerade Ihren Dienst, da er derzeit der einzige ist, der Gemma 4 31b mit einer angemessenen Token-Rate (Durchsatz) bereitstellt.Bei vielen Anfragen antwortet er jedoch mit 429: „Das Modell ist derzeit überlastet. Bitte versuchen Sie es später erneut.“ Das macht den Sinn eines Wechsels zu Ihrem Dienst zunichte, denn selbst wenn ich eine Wiederholungslogik implementiere, dauert die gesamte Antwort länger und es wäre dasselbe, als würde ich einen langsameren und günstigeren Dienst nutzen.Ich würde gerne wissen, ob es einen Zeitplan für die Behebung dieses Problems und die Verbesserung der Zuverlässigkeit von Gemma 4 31b gibt?Vielen Dank,Max

Gemma 4 31b ist häufig überlastet

Hola, estoy probando vuestro servicio porque, por el momento, es el único que admite Gemma 4 31b con una tasa de tokens (rendimiento) aceptable.Sin embargo, en muchas solicitudes, responde con el código 429: «El modelo está sobrecargado actualmente. Inténtalo de nuevo más tarde». Esto frustra el propósito de cambiarme a vuestro servicio, ya que, aunque implemente una lógica de reintentos, la respuesta global tardará más y sería lo mismo que utilizar un servicio más lento y barato.¿Hay alguna fecha prevista para solucionar esto y mejorar la fiabilidad de Gemma 4 31b?Gracias,Max

Gemma 4 31b se sobrecarga con frecuencia

Gemma 4 31b frequently overloaded

Max Loh

Venice.ai

Gemma 4 31b frequently overloaded

Subscribe to post

Subscribe to post